人工智能(簡稱AI)是一門前沿交叉學(xué)科,截至目前還沒有統(tǒng)一的定義。但人工智能誕生于20世紀(jì)50年代,2012年深度學(xué)習(xí)算法通過ImageNet比賽而名聲大噪,逐漸被廣泛采用。2016年AlphaGo戰(zhàn)勝圍棋選手李世石,使AI備受矚目。
2017年AI仍在進(jìn)一步發(fā)展,發(fā)展較多的是在深度學(xué)習(xí)領(lǐng)域,AlphaGo二代技術(shù)升級為AlphaGo Zero、向深度學(xué)習(xí)進(jìn)行技術(shù)升級的CTR預(yù)估等等。計算機(jī)視覺方面發(fā)展平穩(wěn),但自然語音處理方面發(fā)展緩慢需要突破。
這些都將AI推向全球關(guān)注的高點(diǎn),資本的投資、政策的扶持都開啟了AI的新一輪浪潮。
當(dāng)前人工智能的發(fā)展主要集中在訓(xùn)練機(jī)器看懂圖像、聽懂語言、處理大數(shù)據(jù),從而實(shí)現(xiàn)人機(jī)自然交互,輔助人類進(jìn)行自我決策,最終達(dá)到自我決策的目的。要使機(jī)器達(dá)到這一目的,需要三個基本要素的支撐:數(shù)據(jù)、算法、算力。在這三要素中,大量的數(shù)據(jù)是機(jī)器學(xué)習(xí)的根本;算法模型則為機(jī)器學(xué)習(xí)提供了強(qiáng)大的動力與捷徑;算力也可廣義理解為計算系統(tǒng),即指機(jī)器在學(xué)習(xí)的過程中需要的支持承載系統(tǒng)。
在互聯(lián)網(wǎng)的大環(huán)境下,催生出了“大數(shù)據(jù)”,數(shù)據(jù)的完善與充足是人工智能發(fā)展的關(guān)鍵,目前數(shù)據(jù)的來源主要有三種:學(xué)術(shù)界和大公司對外開放的免費(fèi)數(shù)據(jù)庫;通過第三方數(shù)據(jù)供應(yīng)商購買或定制數(shù)據(jù)庫;自行采集或模擬數(shù)據(jù)。
算法決定了人工智能技術(shù)的興衰。作為算法之一的深度學(xué)習(xí)是近年來發(fā)展與研究最多的領(lǐng)域,也引領(lǐng)了人工智能的三度崛起。深度學(xué)習(xí)是一種對數(shù)據(jù)進(jìn)行表征學(xué)習(xí)的機(jī)器學(xué)習(xí)方法,也包含多種模型。而近年來各種理論的提出和實(shí)現(xiàn)都與卷積神經(jīng)網(wǎng)絡(luò)模型(CNN)密不可分,它是一種包含卷積層的神經(jīng)網(wǎng)絡(luò)模型,從1989年CNN的提出到2012年獲得重大技術(shù)突破,再到2016、2017年多種變種模型的興起,CNN在深度學(xué)習(xí)模型的發(fā)展中起到了重要的推動作用。
芯片是算力的核心,算力即廣義理解的計算系統(tǒng)。以人工智能芯片為例,經(jīng)歷傳統(tǒng)的中央處理器(CPU)、運(yùn)算速度較高的圖形處理器(GPU),到目前市場上備受青睞的現(xiàn)場可編程門陣列(FPGA)和專用集成電路(ASIC),人工智能芯片正在朝著運(yùn)算速度高、體積小、能耗小、性能強(qiáng)的方向發(fā)展。
人工智能技術(shù)不斷突破,尤其在自然語言處理、圖像識別、語音識別領(lǐng)域取得了重大進(jìn)步,由此帶動人工智能技術(shù)從實(shí)驗(yàn)室階段向下游應(yīng)用階段發(fā)展。人工智能技術(shù)在不同領(lǐng)域的發(fā)展,需要不同的深度學(xué)習(xí)模型在適應(yīng)的深度學(xué)習(xí)框架上進(jìn)行預(yù)訓(xùn)練,隨后實(shí)現(xiàn)其在特定領(lǐng)域的功能。以語音識別為例,當(dāng)前主流基本上都是基于深度學(xué)習(xí)的框架,基本原理都是把輸入聲學(xué)序列輸出文本串序列,最終目的是實(shí)現(xiàn)通訊和交流。語音識別是最初感知層、從聲學(xué)到文本轉(zhuǎn)換過程,而更難的是在理解層次上。而語音識別新算法的開發(fā)則與具體的應(yīng)用場景和開發(fā)場景相關(guān)聯(lián),盡量簡單的實(shí)現(xiàn)基本影射功能,以解決更多的自由對話交流問題。
在深度學(xué)習(xí)模型CNN的基礎(chǔ)上,發(fā)展較快的模型包括:Alexnet、Resnet、RNN、Googlenet等;目前最流行的深度學(xué)習(xí)框架包括:TensorFlow、Keras、Caffe、MXNet、Torch等。2017年發(fā)布的新結(jié)構(gòu)Capsule從神經(jīng)科學(xué)出發(fā),雖然暫時并沒有應(yīng)用到業(yè)界,但有一定發(fā)展?jié)摿Γ型〈鶦NN。
縱觀全球人工智能產(chǎn)業(yè),美國第一、中國第二,歐洲、日本緊隨其后的格局。
在研究論文的質(zhì)量與數(shù)量上,美國與中國具有壓倒性優(yōu)勢,日本難以比肩。具體地說,美國壟斷了芯片,既有英偉達(dá)、微軟等重量級企業(yè),創(chuàng)業(yè)企業(yè)也層出不窮;中國則是在AI應(yīng)用領(lǐng)域發(fā)展勢頭強(qiáng)勁,初創(chuàng)企業(yè)較多;日本則是在人工智能機(jī)器人上發(fā)展較好。
人工智能產(chǎn)業(yè)帶動GDP增長,體現(xiàn)最為突出的是中國、其次為美國,日本則較為落后。中美日IT人才數(shù)量龐大,但是年均收入水平上中美明顯高于日本,這也是制約日本人才培養(yǎng)的一方面原因。
隨著人工智能技術(shù)日益滲透當(dāng)前社會的方方面面,其作為未來科技發(fā)展的一個決定性領(lǐng)域,已在全球范圍內(nèi)掀起了競爭熱潮。在AI技術(shù)的發(fā)展和利用上,中美日各有優(yōu)勢,將持續(xù)高速發(fā)展。
▏本文作者:材料委天津院
聯(lián)系客服