<序>
你信不信有一天,硅造的芯片會寫詩?
如果信,
那說好的「詩三百,一言以蔽之,思無邪」
還真的是「無邪」么?
如果不信,請讀下面這一首
昨夜神風送層云,幾重卷積幾重生
夢里不問形與令,燭臺簇華照單影
真北路頭初相見,一見泰坦誤終身
半入豪門尋極樂,日起地平寒武競
如果要給這詩一個賞析,大概可以是一個憂傷的故事。天邊云的變換復雜,而我卻是半夢半醒,我在想一個人,想第一次和他相見,想他的風流倜儻,想他的英雄颯爽。
如果你是個文科生,或許你會嘲笑這首連平仄都不滿足的劣質(zhì)詩歌,韻腳也押的有些蹩腳,故事更是為賦新詞強說愁。如果你是理科男,或許對這種思春的小情懷不以為然。
不過,那是因為你們并沒有看懂這首詩。因為這詩暗藏了一個密碼,藏著人工智能遇到摩爾定律后蹭出的火花。
另外,這詩不是人工智能的產(chǎn)物,只是矽說在這個人工智能橫行的年代里特有的小情懷。
但可能在不遠的將來,人工智能將會開車,會翻譯,會調(diào)情,也會寫下更美的篇章。
想解開這個人工智能與集成電路的秘密?
「機器之心」和「矽說」共同推出了系列文章「腦芯編」,揭秘類腦芯片的過去、現(xiàn)在與未來。
「矽說」的撰稿人來自 UCLA、UW、臺灣交大等半導體業(yè)頂尖高校以及業(yè)界頂尖公司,希望能把自己的所見所聞與大家分享。
讓我們一起把這首詩一句一句地讀下去。
我們會:
1)定期分享系列文章。
2)組建微信群,方便大家一起討論、學習和交流,我們也會邀請更多專業(yè)人士在群里進行分享。(申請方式見文末)
第一篇——昨夜神風送層云
在我讀書的時候,人工智能(Artifical Intelligence, AI)從來就是 CS (Computer Science)的天下,哪有電路攛掇的份。那時候的碼農(nóng)們或許會掛著機器學習,數(shù)據(jù)挖掘,支持向量機,壓縮感知……但從來沒有一次,電路的突破是由人工智能推動的??墒窃诮裉?,如果你打開半導體行業(yè)的利好消息,有多少不是和人工智能,深度學習相關(guān)的?
過去一個月,光在半導體巨頭們發(fā)生的人工智能的故事就足以吊足大家的胃口。何況,這還是只是很多硅工心目中的人工智能元年。
從人工智能到神經(jīng)網(wǎng)絡(luò)
在人工智能改變半導體行業(yè)之前,在人工智能領(lǐng)域發(fā)生過一場「華山論劍」,耗時數(shù)載,最終以「深度學習神經(jīng)網(wǎng)絡(luò)(Deep Learning Neural Network)」一統(tǒng)江湖落下帷幕。該過程腥風血雨,而主角「神經(jīng)網(wǎng)絡(luò)」的遭遇更堪比張無忌、楊過,歷經(jīng)少年時的悲慘遭遇,被無數(shù)號稱時代「大俠」嗤之以鼻,但終究是主角光環(huán)加持,加之得外家指點,十年一劍終成大器,號令天下,誰敢不從。
本篇對這里其中的故事,按下不表,有好事者,可以去各處搜搜,劇情精彩不容錯過。但是這里還是要感謝,在神經(jīng)網(wǎng)絡(luò)經(jīng)歷最寒冬的時候,一眾大牛如 Yann LeCun 、 Geoffrey Hinton 等的默默堅守,才有神經(jīng)網(wǎng)絡(luò)的今天。不過他們也早已是 Facebook 和谷歌的科學家,如今功成名就,也是吾等小輩無法企及的高度。
Yann LeCun, Geoffrey Hinton
神經(jīng)網(wǎng)絡(luò)在人工智能領(lǐng)域,屬于機器學習一路的分支。所謂機器學習,就是讓電腦經(jīng)過學習后代替人腦做出判斷、理解,甚至訣定(還記得贏了李世石的 AlphaGo 么?),而所謂深度學習和淺學習的區(qū)別在于設(shè)計者是否告訴電腦的學習策略。
最常見的例子是大家電子郵件系統(tǒng)里的垃圾郵件分類,一般一份郵件是否是垃圾郵件,在于它是否滿足一些標準,比如是不是群發(fā)的,有沒有叫你買東西的廣告,是不是圖片占有比例很高,然后發(fā)信人有沒有被舉報過等等……這些標準都是一個個特征,如果一種機器學習方法規(guī)定了學習的特征與策略,那就是淺學習,如果沒有規(guī)定,需要算法本身去挖掘策略,那就是深度學習。
所以,深度學習的一大隱憂就是——人類并不知道算法本身究竟在想什么?所以如果哪天他在他負責的算法下隱藏了一個暗算/統(tǒng)治人類的 bug,那我們就被徹底奴役了。
不過,所謂「莊生曉夢迷蝴蝶」,人類自己究竟是不是被另外一個物種開發(fā)出來的一種新智慧呢?然后,那個物種是不是已經(jīng)被我們滅絕了呢?我們并沒有答案。
碼農(nóng)老師教的生物課
為了弄清這橫掃千軍的神經(jīng)網(wǎng)絡(luò),首先讓我們來上一堂不污的生物課。既然叫神經(jīng)網(wǎng)絡(luò),那起源就是生物腦科學。很久以前,人們發(fā)現(xiàn)一個單神經(jīng)細胞(也叫神經(jīng)元)包括輸入(樹突 dendrites),激活判斷(細胞核 nucleus),輸出(軸突 axon)和與下一個神經(jīng)元的連接關(guān)系(突觸 synapse)。如果用數(shù)學抽象出來過程,就是把一堆輸入經(jīng)過線性組合以后經(jīng)過一個閾值判斷,然后輸出給下一級。這樣一個簡單的神經(jīng)元就形成。把足夠多個神經(jīng)元連起來就能實現(xiàn)神經(jīng)網(wǎng)絡(luò)了。
上面兩個圖就是真實的神經(jīng)元和它的數(shù)學模型。(不過我還是要吐槽下:誰起的中文?樹突與突觸傻傻分不清 )
從上述神經(jīng)元的提出,到許多仿生的算法結(jié)構(gòu)的研究,如多層感知器(Multilayer Perceptron) ,脈沖神經(jīng)元(Spiking Neural)之類的,經(jīng)過了一個甲子的時間,特別但都沒沒什么巨大的成功,原因有兩個:
1)當時的集成電路計算規(guī)模與資源遠沒有達到面向?qū)嶋H應(yīng)用的需求,仔細去研究神經(jīng)元的數(shù)學模型,會發(fā)現(xiàn)每個神經(jīng)元有若干個權(quán)重和成累加計算 。他對應(yīng)匯編可以大致是如下流程:
累加器清零 (mov)
-- 循環(huán)開始 (branch)
從存儲器中加載權(quán)重 (load)
從存儲器/外設(shè)中加載輸入 (load)
權(quán)重 乘以 輸入 (multiply)
累加 (add)
-- 判斷是否重新循環(huán) (goto)
激活函數(shù) (??)
輸出 存儲 (store)
對于一個 N 輸入的神經(jīng)元要走 N 個循環(huán),這對于上個世紀的單核單線程的 CPU,實在是操作難度太復雜。這也就是為什么當流水線與并行處理 不斷壯大的近十年,神經(jīng)網(wǎng)絡(luò)的發(fā)展得到了迅猛發(fā)展。
2)連得不對。這短短四個字,雖說的輕巧,但要找到連連看的竅門,著實花費了多少人的青春?關(guān)于怎么連,各位看官先別著急,且聽腦芯編下回分解。
作為腦芯編的開篇,今天就到這里,所謂「神風送層云」指的就是集成電路的下一個增長點或許就在在人工智能領(lǐng)域取得巨大成功的神經(jīng)網(wǎng)絡(luò)硬件實現(xiàn)上。
「人工智能芯片硬件微信討論群」,通過以下方式申請,我們在審核通過會邀請入群。
1)Google forms (點擊查看原文)
2)http://www.diaochapai.com/survey/69e11a55-6f6d-44b9-baf0-31ccf8a946f7
3)微信后臺留言,請注明「職業(yè)」+「所在機構(gòu)」+「在人工智能芯片硬件領(lǐng)域的相關(guān)研究和產(chǎn)業(yè)背景」
歡迎關(guān)注矽說公眾號:silicon_talks
序>聯(lián)系客服