這一周英特爾放出兩個重磅消息:其一是3月16日英特爾與康奈爾大學利用英特爾神經(jīng)擬態(tài)芯片Loihi來識別爆炸物等危險化學品氣味方面的研究,取得重大的突破。其二是3月19日英特爾用768個Loihi芯片構(gòu)造了一個新的神經(jīng)擬態(tài)研究系統(tǒng)Pohoiki Springs,這個系統(tǒng)達到了1億個神經(jīng)元的規(guī)模,而上一次構(gòu)建的系統(tǒng)Pohoiki Beach是64個芯片800萬個神經(jīng)元,這次擴大了12倍。
在這兩個重磅消息的背后釋放出許多重要的信號,人類對于除視覺、聽覺之外的味覺嗅覺等研究有新突破,帶來新想象空間和應用空間,人類對大腦的認知以及類腦芯片、AI芯片又跨上新臺階,未來的芯片發(fā)展之路又有可能另辟蹊徑。這一切、一切的背后有諸多信息需要解密,3月20日,《中國電子報》記者連線采訪英特爾中國研究院院長宋繼強。
嗅覺和味覺AI為什么遠比視覺和聽覺AI要落后?
我們知道人類在視覺、聽覺識別方面相對成熟,但在味覺、嗅覺等方面識別仍面臨很多挑戰(zhàn)。而這次在英特爾與康奈爾合作在氣味和爆炸物識別的突破有什么突破意義?關于味覺、嗅覺識別的主要的挑戰(zhàn)是什么?通常采用什么樣的路徑來解決這類問題?
宋繼強表示,人類的味覺靠舌頭、嗅覺靠鼻子,目前為止,人工智能做得比較好的是視覺、聽覺,這兩個人類主要感官。之所以在兩個領域做的比較好,有幾個原因,其一是視覺、聽覺兩類數(shù)據(jù)相對容易獲得而且數(shù)據(jù)量大。在此前的信息化時代,比如2000年開始攝像頭普及,更早時候麥克風普及,讓我們積累了大量圖片數(shù)據(jù)、語音數(shù)據(jù)。其二是這兩類數(shù)據(jù)的標注相對容易。人類基于捕捉下來的照片或是錄制的音頻進行標注,基于人類的基本認知知識容易實現(xiàn),容易確定它的正確與否。
“而深度學習之所以能夠獲得現(xiàn)在的效果是因為幾個關鍵:第一數(shù)據(jù)量足夠,第二有標注好的數(shù)據(jù),第三是要保證訓練的數(shù)據(jù)集和未來要處理的問題的測試數(shù)據(jù)集的分布是一致的,這樣訓練出來的模型,才能夠很好地處理真實的場景?!彼卫^強表示,這也是為什么我們看到深度神經(jīng)網(wǎng)絡擅長處理視覺數(shù)據(jù)、語音數(shù)據(jù)的原因。
而嗅覺和味覺,目前的數(shù)據(jù)非常少,而且沒有很好地標注。究竟誰可以將這些數(shù)據(jù)進行標注非得是專家在實驗室才可以進行。比如葡萄酒的品酒,同一個葡萄酒十個專家來品嘗可能會有不同的結(jié)果,同一個葡萄酒讓同一個專家在不同的時間段品,也可能打出不同的分。所以它有難度。
“數(shù)據(jù)量不夠多,而且主觀評測標準也不夠,味覺的差異性太大。嗅覺相對客觀一些,因為嗅覺本身是依據(jù)不同的氣味,主要源于空氣中包含的一些化學分子成份不同、密度不同。人的鼻子、動物的鼻子、電子鼻對于氣味的區(qū)分能力不一樣。普通人能夠區(qū)分三四百種不同氣味,稍加訓練可以達到上千種、數(shù)千種,但現(xiàn)實中真正可以區(qū)分的氣味其實是在萬種以上,這些數(shù)據(jù)我們?nèi)粘:茈y拿到大量數(shù)據(jù),所以它絕對是小數(shù)據(jù)量的場景。”宋繼強說。
但嗅覺數(shù)據(jù)的使用場合非常多,比如爆炸品的檢測,比如生活中危害、有害氣體的提早檢測,比如對水果或農(nóng)作物的成熟度檢測,比如對檢修污染的檢測等,靠氣味能夠檢測的非常多。目前因受限于數(shù)據(jù)量不夠充分,檢測手段不夠高明,嗅覺AI的發(fā)展比視覺和聽覺落后非常多。
為什么用神經(jīng)擬態(tài)計算而不是其他計算?
我們知道人工智能發(fā)展有三個關鍵:數(shù)據(jù)、算法、算力,為什么解決嗅覺、味覺等問題上要采用類腦計算,而不是其他的計算來解決這些問題?神經(jīng)擬態(tài)計算比其他計算解決此類問題有什么優(yōu)點?用量子計算是不是也可以很好地解決此類問題?
宋繼強表示,神經(jīng)擬態(tài)計算的優(yōu)勢在于,第一,不需要依賴于大量的數(shù)據(jù)。神經(jīng)擬態(tài)計算可以從一個樣本的訓練中就可以達到百分之九十多的相對比較高的準確率,這和過去人們專門去定制一些規(guī)則特征來識別的效果非常相似。人定立規(guī)則的意思是,假如我知道這個氣味由哪幾種分子構(gòu)成,比如二氧化硫是臭雞蛋味,我就可以知道這其中什么樣的分子會導致臭雞蛋味,可以定制一些化學傳感器、其他的有機物傳感器來指定檢測這兩種特定的分子構(gòu)成,然后標注成這是二氧化硫的氣味。但神經(jīng)擬態(tài)芯片不需要人做這樣的劃分,而是直接取出來。這張Loihi識別模型圖很好地解釋了神經(jīng)擬態(tài)芯片做這件事情的機理。
它是從人腦做嗅覺識別的過程去獲得啟發(fā),人是通過鼻腔讓空氣吸進來,如果想甄別味道更快,可能要快速呼吸幾下,讓它的濃度、流動的速度都加快起來,可以接觸到更多氣味。所以它是讓空氣流動和鼻子里的傳感細胞接觸。這張圖里還顯示出傳感細胞分成幾種、每種的構(gòu)造以及不同的感知細胞。然后連到底下的感知神經(jīng)元,感知細胞相當于我們在構(gòu)造電子鼻時,放了一些化學傳感器或者有機物傳感器。這樣我們就構(gòu)造出一個類似于人的鼻腔通道,然后感知氣體流過它的分子接觸,傳感細胞時間的、空間的序列,構(gòu)造出一個陣列一樣的傳感器的組合,就可以在氣味經(jīng)過的時候形成一個時間上的脈沖序列,然后它有空間上的分布。這就與人的嗅覺系統(tǒng)的感知機理比較接近。同時因為人腦里是靠神經(jīng)元機制形成刺激-激勵,形成以后要在神經(jīng)元里累積,累積以后要去釋放,就與神經(jīng)擬態(tài)系統(tǒng)怎么用SNN模型,也就是脈沖神經(jīng)網(wǎng)絡的模型去模擬它相關。所以神經(jīng)擬態(tài)芯片是比較容易讓人們構(gòu)造一個模型,包含對時間和空間序列處理的一個模型,然后放在它上面,對數(shù)據(jù)進行模式的匹配。通過這一測試能把它的模式很好地記錄下來,記錄下來之后再碰到這樣一個氣味就能夠產(chǎn)生最高響應。同時為了不要讓其他可能的氣味誤識為它,這個陣列需要構(gòu)造得比較大,上面?zhèn)鞲屑毎膫鞲衅鞣N類要更多。
“從這個工作圖上我們看到了它從理論到實踐的基礎,以及可以擴展識別更多種類氣體的擴展化的路徑?!彼卫^強說,神經(jīng)擬態(tài)芯片解決了如何可以在低成本、數(shù)據(jù)量很少、功耗很低的背景下來解決聞味的問題。因為在一個Loihi芯片上構(gòu)造這樣的系統(tǒng),它的功耗非常低,功耗只是毫瓦級別,無論是是訓練還是識別都不需要花太多電,所以可以把它做成類似于“電子鼻”的小設。而且它可以擴展去識別很多種類的氣體。
那么量子計算等其他計算是否能夠擁有與神級擬態(tài)計算一樣的解題能力?宋繼強表示,當然也可以用傳統(tǒng)計算機來解題,但如果是傳統(tǒng)計算機就需要構(gòu)造更精巧的算法,在傳統(tǒng)的CPU上當然可以模擬各種各樣的計算場景,但是執(zhí)行效率肯定不如在Loihi上這么直接、這么低功耗。而量子計算是適合做大規(guī)模有并行選項同時驗證的事情,并不是適合做嗅覺識別,因為嗅覺識別需要針對只有少量的、有時間序列的數(shù)據(jù),進行快速判別。
Pohoiki Springs難在哪里?有什么突破意義?
英特爾這次公布的新系統(tǒng)Pohoiki Springs研發(fā)難度有多大?與上一代的系統(tǒng)相比有哪些突破?這些突破有什么意義?
宋繼強表示,Pohoiki Springs是在上一代Pohoiki Beach的基礎上繼續(xù)進行大規(guī)模的互聯(lián)。首先把互聯(lián)的規(guī)模加大,加大后面臨幾個問題:第一互聯(lián)之后怎么保證這些信息的傳遞,我們知道在一個64芯片的Pohoiki Beach板級方案上,所有的芯片之間的連接是在一塊電路板上,所以它們之間的速度是比較一致,很有保障的。當我們把12倍的板子連起來時,那就要增加更多的I/O連接組建和信息傳遞協(xié)議的處理,如何保證信息傳遞的有效和時效性。
第二是在上面支持軟件開發(fā)的時候,要更好地把硬件連接差異掩蓋掉,讓大家非常容易使用,就像使用一個大腦組織一樣,不同的分區(qū)可能不同有功能的組合,實現(xiàn)靈活分區(qū)使用,這需要一個分布計算的軟件層支持,所以這一層也比較關鍵。
第三是這上面要開發(fā)一些新模型也會涉及到更大規(guī)模的模型的設計和處理,這也比在小芯片上要困難。
它的難度分為三層,一是底層如何把這么多塊芯片互連起來,把它全部連接起來同時要保證連接的有效性和時效性,這在業(yè)界沒有做過。二是軟件層,要支持互連計算、分布式計算和靈活分區(qū),這也是沒有人做過的。三是支持更大規(guī)模的做動態(tài)規(guī)劃和優(yōu)化的實驗,這也是英特爾首先做。
為什么要做這樣一個大規(guī)模的系統(tǒng)?宋繼強表示,因為在很多領域的應用里要做優(yōu)化、約束滿足、動態(tài)規(guī)劃時,需要耗費很多時間需要消耗很多電力,而切換算法在神經(jīng)擬態(tài)芯片Loihi上做可以更快、功耗更低。
類腦計算何時真正接近于人腦?
計算機在不斷接人腦的維度上,目前走到了哪一步?如果我們用小溪、小河到大海來形容現(xiàn)在走到了哪一個程度?還要突破哪些屏障才能真正走到大海?
“這比較難給出確切答案?!彼卫^強說,一方面因為人類對于大腦的了解和認知進展并不像摩爾定律的那樣高速,它的進展非常緩慢。現(xiàn)在對于神經(jīng)元結(jié)構(gòu)基本了解,對于某些人的感知機理也有了解,特別像視覺、聽覺、嗅覺這些比較重要的感知機理有所了解,但其他更深層次的感知、認知是怎么形成依然不了解。不過現(xiàn)在Loihi設計用的比較復雜的腦神經(jīng)元的工作模型,這是我們首先可以借鑒的。另一方面在器件上,人腦的工作方式和傳統(tǒng)的半導體的工作機理也并不完全一樣,所以我們也在做新的底層器件研發(fā),比如憶阻器,既可以存儲也可以計算的一種器件。
不過,宋繼強進一步表示,除了我們對人腦的認知機制與工作機制的了解需要繼續(xù)推進,我們還需要換一個維度,從超出人腦來看IT能夠帶來什么。“我們說人腦很神秘、很厲害,但是畢竟是一個生物組織,有它的極限。我現(xiàn)在手里有一個更強的武器比如IT、半導體、量子計算等工具,它會有比人腦更強的能力?!比绾卫眠@些東西、利用這些芯片與人腦的研究相結(jié)合、跨學科結(jié)合就能夠更好地往前推進。
“最重要的是需要找到很好的應用導向?!彼卫^強表示,比如英特爾對于Loihi研究, Loihi的主要貢獻一方面它是新的架構(gòu)設計,實現(xiàn)了大規(guī)模集連,而且把工具鏈做起來了。另一方面是Loihi構(gòu)建了一個社區(qū)(英特爾神經(jīng)擬態(tài)社區(qū)INRC),社區(qū)中不僅有所類腦神經(jīng)擬態(tài)計算研究的學術機構(gòu),也吸納進來非常多不同種類的創(chuàng)業(yè)公司、五百強企業(yè),希望通過探索看看這樣的神經(jīng)擬態(tài)計算能夠很好地解決哪些應用領域問題,由此來驅(qū)動神經(jīng)擬態(tài)計算的發(fā)展。就像2012年深度學習在學術界嶄露頭角之后,于2016、2017年在產(chǎn)業(yè)界大規(guī)模使用于安防領域、生物認證領域、金融領域等,以這樣的發(fā)展路徑能夠形成從技術到規(guī)?;瘧玫纳鷳B(tài)?!斑@是一個并行發(fā)展而不是線性發(fā)展的事情,所以很難給你一個預測時間。” 宋繼強同時表示神經(jīng)擬態(tài)芯片在英特爾的芯片布局中屬于研究測試芯片,不是一個產(chǎn)品芯片,主要是在服務研究社區(qū)。未來如果有更大規(guī)模的商業(yè)應用場景,不排除將其通用化。
聯(lián)系客服