昨日“人機(jī)對(duì)決”的硝煙還未散盡,今天上午 9 點(diǎn) 30 分DeepMind的掌門人哈薩比斯就在烏鎮(zhèn)發(fā)表了《 AlphaGo 研發(fā)介紹, AlphaGo 意味著什么?》的主題演講,將“怪獸”AlphaGo背后的重大升級(jí)細(xì)節(jié)和盤托出。不得不說(shuō),在經(jīng)歷了幾番和人類選手的比拼之后,人工智能的力量已經(jīng)進(jìn)化的了難以想象的層次。
除此以外,在這次的論壇上,AlphaGo的主要開(kāi)發(fā)者大衛(wèi)·席爾瓦(David Silver)和谷歌大腦(Google Brain)團(tuán)隊(duì)負(fù)責(zé)人杰夫·迪恩(Jeff Dean)同時(shí)進(jìn)一步揭秘了脫胎換骨之后的全新AlphaGo。
據(jù)悉,相較于之前12層卷積神經(jīng)網(wǎng)絡(luò)的AlphaGo,此次出戰(zhàn)的AlphaGo已經(jīng)達(dá)到的40層神經(jīng)網(wǎng)絡(luò),性能較上次和人類大戰(zhàn)60回合的Master也有了增強(qiáng),更是比李世石的那一版強(qiáng)了三子的優(yōu)勢(shì)。正是在這種不斷自我訓(xùn)練的情況下,AlphaGo已經(jīng)生成了一代強(qiáng)過(guò)一代的神經(jīng)網(wǎng)絡(luò)。
圖丨DeepMind團(tuán)隊(duì)預(yù)測(cè),Master版本比李世石版本提升了三子
如今的AlphaGo無(wú)論從哪個(gè)角度看都更像是一臺(tái)獨(dú)立的高性能秘密武器。憑借著十個(gè)谷歌自研的TPU,它擺脫了對(duì)外界的依賴;使用自己所積累的數(shù)據(jù);更強(qiáng)大的策略網(wǎng)絡(luò)和價(jià)值網(wǎng)絡(luò)提高了的反應(yīng)速度和判斷的準(zhǔn)確性……強(qiáng)化學(xué)習(xí)的優(yōu)勢(shì)在AlphaGo身上表現(xiàn)得淋漓盡致,并且還將結(jié)出更加豐碩的成果。
以下是DT君在現(xiàn)場(chǎng)的編輯整理后哈薩比斯今日主題演講的內(nèi)容精選:
我先簡(jiǎn)單介紹一下 DeepMind。2010 年,DeepMind 創(chuàng)立于英國(guó)倫敦,2014年我們加入 Google。我們想要做的就是攻克人工智能。
對(duì)于 DeepMind 而言,我們希望網(wǎng)絡(luò)全世界的機(jī)器學(xué)習(xí)科學(xué)家,能夠結(jié)合計(jì)算能力,盡快解決人工智能的問(wèn)題。另外,DeepMind 為了更好的進(jìn)行研發(fā),創(chuàng)新了我們的組織方式。
可以說(shuō),Deep Mind的任務(wù)可以分兩步走:
第一步是要從根本上了解智能是什么,然后用人工方法去創(chuàng)造它。接下來(lái)就是要通過(guò)這種智能去嘗試解決其他所有問(wèn)題。我們認(rèn)為,AI會(huì)是人類歷史上最重要的技術(shù)發(fā)明之一。
具體來(lái)說(shuō)我們會(huì)怎么做?在DeepMind,我們常會(huì)提到要建立通用型學(xué)習(xí)系統(tǒng)。最核心的概念就是“學(xué)習(xí)”,我們開(kāi)發(fā)的所有系統(tǒng)都有學(xué)習(xí)相關(guān)的內(nèi)核,這種學(xué)習(xí)系統(tǒng)從實(shí)踐經(jīng)驗(yàn)和數(shù)據(jù)中學(xué)習(xí),而不需要預(yù)先輸入程序化的解決方案。
第二步是要解決AI的通用性問(wèn)題。我們認(rèn)為,單一系統(tǒng)或者算法組合并不能直接解決各種問(wèn)題,更不用說(shuō)以前沒(méi)遇到過(guò)的問(wèn)題。這種系統(tǒng)最好的例子就是人腦,我們從某一任務(wù)中學(xué)習(xí),并相關(guān)經(jīng)驗(yàn)應(yīng)用于其他未遇到過(guò)的問(wèn)題,即所謂的舉一反三。而機(jī)器在這方面是有很大問(wèn)題的,DeepMind就是想賦予機(jī)器這種能力。
打造這種通用型學(xué)習(xí)系統(tǒng)涉及到幾項(xiàng)關(guān)鍵技術(shù)。首先是深度學(xué)習(xí),即層疊的神經(jīng)網(wǎng)絡(luò),這個(gè)大家都很熟悉了;然后是強(qiáng)化學(xué)習(xí),即讓機(jī)器自己學(xué)習(xí),以達(dá)到最大化的收益。
我們將這種具有通用目標(biāo)的學(xué)習(xí)系統(tǒng)稱為通用型人工智能,這與目前所謂的人工智能是不一樣的,因?yàn)槟壳暗娜斯ぶ悄苤饕€是預(yù)先寫(xiě)入的程序而已。
實(shí)際上,打造通用型學(xué)習(xí)系統(tǒng),最重要的是要學(xué)習(xí)。所有算法都會(huì)自動(dòng)學(xué)習(xí),更多的數(shù)據(jù)和更多的體驗(yàn)不依賴于預(yù)設(shè)。
通用型的強(qiáng)人工智能與弱人工智能不一樣。最好的例子就是,在90年代末IBM開(kāi)發(fā)的“深藍(lán)”系統(tǒng),擊敗了當(dāng)時(shí)頂尖的國(guó)際象棋高手卡斯帕羅夫——這在當(dāng)時(shí)是很大的成就,但“深藍(lán)”終究是一套預(yù)先寫(xiě)入程序的系統(tǒng),相當(dāng)于一位頂級(jí)程序員在和卡斯帕羅夫?qū)模@位程序員嘗試揣摩卡斯帕羅夫腦子里在想什么,并把相應(yīng)的對(duì)策全部編寫(xiě)到程序里。這個(gè)技術(shù)了不起,但它不能解答人工智能之路在哪,只是在執(zhí)行預(yù)先寫(xiě)入的命令,而不是自己來(lái)學(xué)習(xí)、決策。
然而,人類的大腦學(xué)到新的知識(shí)后卻可以舉一反三,我們可以用習(xí)得的現(xiàn)有經(jīng)驗(yàn)解決新的問(wèn)題,這是機(jī)器所不擅長(zhǎng)的。
所以說(shuō),與之前的相比,我們想要的是能夠自我學(xué)習(xí)的系統(tǒng),而這種系統(tǒng)需要在強(qiáng)化學(xué)習(xí)的框架下來(lái)開(kāi)發(fā)。有必要先稍微解釋一下到底什么是所謂的強(qiáng)化學(xué)習(xí)。
在人工智能系統(tǒng)中,有一個(gè)我們稱之為Agent的主體,Agent發(fā)現(xiàn)它身處某種環(huán)境下,并需要完成某些任務(wù)。如果周圍的環(huán)境是真是世界,Agent可能會(huì)是一個(gè)機(jī)器人;但如果周圍環(huán)境是諸如游戲這類虛擬環(huán)境,Agent就可能是一個(gè)虛擬形象(Avatar)。
要完成某個(gè)任務(wù),Agent會(huì)通過(guò)兩種方式與環(huán)境互動(dòng)。首先是傳感器,DeepMind更多會(huì)使用視覺(jué)傳感器讓機(jī)器與環(huán)境互動(dòng),當(dāng)然,如果你愿意,也可以使用語(yǔ)音、觸覺(jué)等方式。所以這類Agent通常通過(guò)自己的觀察來(lái)對(duì)環(huán)境建模。但是這里有個(gè)問(wèn)題,真是環(huán)境通常是充滿噪聲、干擾、不完整的,所以需要Agent盡最大努力去預(yù)測(cè)周圍到底是什么樣的。
一旦這個(gè)環(huán)境模型建立,就要開(kāi)始第二步了:如何在這個(gè)環(huán)境中做出最好的行為決策。當(dāng)然,行為與環(huán)境間的互動(dòng)可能是成功的,也可能是失敗的,這寫(xiě)結(jié)果都會(huì)被實(shí)時(shí)納入Agent的觀察過(guò)程,這也就是強(qiáng)化學(xué)習(xí)的過(guò)程。
這兩年來(lái),AlphaGo團(tuán)隊(duì)專注于圍棋項(xiàng)目。與象棋相比,圍棋更加復(fù)雜。對(duì)于象棋來(lái)說(shuō),寫(xiě)一個(gè)評(píng)價(jià)函數(shù)是非常簡(jiǎn)單的。另外,圍棋更需要直覺(jué),偉大的旗手往往難以解釋他們?yōu)槭裁聪铝诉@一步棋,象棋選手則可以給一個(gè)明確的答案,回答這么走的原因,有時(shí)候也許不盡如人意,但是起碼選手心中是有清晰的計(jì)劃的。
為什么圍棋的評(píng)估方程式這么難?相比象棋,圍棋是因?yàn)闆](méi)有物質(zhì)性的概念,每一個(gè)棋子是等值的,而象棋有由估值的高低的。第二,圍棋是建設(shè)性的,圍棋是空的,你需要填充棋盤。特殊位點(diǎn)的評(píng)估,期盼在你心中,不斷摸索,圍棋手是建設(shè)性的,一切情況不得而知,需要棋手預(yù)測(cè)未來(lái),進(jìn)行布局,而象棋往往講究當(dāng)下的時(shí)局。
另一個(gè)原因,一個(gè)棋子怎么走,一步輸步步輸,一發(fā)全身。圍棋更具有直覺(jué)性,歷史中我們覺(jué)得這是神的旨意,由靈感指導(dǎo)行為。
那么我們?cè)趺磳?xiě)出這個(gè)方程式呢?策略網(wǎng)絡(luò)……縮小范圍……價(jià)值網(wǎng)絡(luò)。我們?cè)?jīng)在《Nature》上發(fā)布了相關(guān)的論文,論文幫助一些國(guó)家和公司打造了他們自己版本的AlphaGo。
接下來(lái),我們用比賽來(lái)測(cè)試更新的系統(tǒng),比如上一次的李世石,昨天的柯潔,這兩次比賽都引起了很大的關(guān)注。在和李世石的比賽中,AlphaGo贏了。但其實(shí),我們十年磨一劍。勝利是很難的,也是很了不起,在AI領(lǐng)域更是這樣,十年磨一劍是常事。
我們贏了,最重要的是我們激發(fā)了更多的靈感,AlphaGo打出了好局,和李的比賽中,第二局第37不起令人驚嘆。這是專業(yè)人員都難以想象的,已經(jīng)觸及到下棋的直覺(jué)方面。
AlphaGo把圍棋看做客觀的藝術(shù),每下一步旗子都會(huì)產(chǎn)生客觀影響,而且它還能下得非常有創(chuàng)意。李世石在比賽中也受到了啟發(fā),他在第四局的第78著也很美妙,因此他贏了一局。
毫無(wú)疑問(wèn),AlphaGo對(duì)戰(zhàn)李世石的影響很大,全世界28億人在關(guān)注,35000多篇關(guān)于此的報(bào)道。西方世界開(kāi)始更多地感受到圍棋這種東方游戲的魅力,當(dāng)時(shí)圍棋的銷量還漲了10倍。我們很樂(lè)意看到西方世界也學(xué)習(xí)這種游戲。而李世石也有新的發(fā)現(xiàn),他在賽后表示,和狗比賽是其人生最美的體驗(yàn),狗也為創(chuàng)造了圍棋的新范式,李表示他對(duì)圍棋的興趣更大了,我開(kāi)心他這么說(shuō)。
回到直覺(jué)和創(chuàng)意上。什么是直覺(jué)?人們通過(guò)各種體驗(yàn)獲得經(jīng)驗(yàn),這是無(wú)法繼承,人們接受測(cè)試來(lái)檢驗(yàn)他們直覺(jué)。AlphaGo已經(jīng)能模仿直覺(jué)。而創(chuàng)造力上,它的一個(gè)定義是,整合新的知并創(chuàng)造新的點(diǎn)子或知識(shí),阿狗顯然是有創(chuàng)造力,但這種創(chuàng)造力仍然僅局限于圍棋。
在過(guò)去一年中,DeepMind不斷打造AlphaGo,希望能解決科學(xué)問(wèn)題并彌補(bǔ)它的知識(shí)空白,我們還將繼續(xù)完善它。之后,Master出現(xiàn)了,我們?cè)诮衲暌辉聦?duì)他進(jìn)行上線測(cè)試,他取得了60連勝,還誕生了很好的點(diǎn)子,它的棋譜被全世界的棋手們研究。例如,AlphaGo打了右下角三三目,這種舉措在之前是不可想象的。
柯潔也說(shuō),人類3000年圍棋歷史,至今沒(méi)有一人曾經(jīng)接近過(guò)到圍棋真理的彼岸。但是,人和AI的結(jié)合可以解決這個(gè)問(wèn)題。古力也說(shuō),人類和AI共同探索圍棋世界的腳步開(kāi)始了。
昨晚晚宴上,我了解到了圍棋大師吳清源的故事??赡蹵lphaGo也能帶來(lái)圍棋的新篇章,就像吳當(dāng)年為圍棋貢獻(xiàn)的革命性力量一樣。象棋的下發(fā)都是策略性的,而AlphaGo能想出非常有戰(zhàn)略性的點(diǎn)子,也給棋手們帶來(lái)新點(diǎn)子。
曾經(jīng)和DeepBlue(深藍(lán))對(duì)戰(zhàn)的象棋世界冠軍GarryKasparov出過(guò)一本書(shū),描述了他的一個(gè)觀點(diǎn):深藍(lán)的時(shí)代已經(jīng)結(jié)束了,狗的時(shí)代才剛開(kāi)始。沒(méi)錯(cuò),AlphaGo是通用人工智能,未來(lái)我們能看到人機(jī)結(jié)合的愿景,人類是如此有創(chuàng)意的生物,我們可以能在AI的幫助下變得更強(qiáng)大。
AlphaGo是人類的新工具。就像天文學(xué)家利用哈勃望遠(yuǎn)鏡觀察宇宙一樣,通過(guò)AlphaGo,棋手們可以去探索圍棋的未知世界和奧秘。我們發(fā)明AlphaGo,也希望能夠推動(dòng)人類文明進(jìn)步,更好地了解這個(gè)世界。
我們的愿景是最優(yōu)化他,最完美他。就像圍棋3000年以來(lái)都沒(méi)有答案,科學(xué)、技術(shù)、工程等領(lǐng)域也正面臨著同樣的瓶頸,但是,現(xiàn)在有了AI,我們迎來(lái)了新的探索機(jī)會(huì)。
圍棋比賽是我們測(cè)試人工智能的有效平臺(tái),但我們的最終目的是把這些算法應(yīng)用到更多的領(lǐng)域中。人工智能(特別是強(qiáng)人工智能)將是人們探索世界的終極工具。
當(dāng)今世界面臨著很多挑戰(zhàn),不少領(lǐng)域本身有著過(guò)量的信息和復(fù)雜的系統(tǒng),例如醫(yī)療、氣候變化和經(jīng)濟(jì),即使是領(lǐng)域內(nèi)的專家也無(wú)法應(yīng)對(duì)這些問(wèn)題。
我們需要解決不同領(lǐng)域的問(wèn)題,人工智能是解決這些問(wèn)題的一個(gè)潛在方式,從發(fā)現(xiàn)新的材料到新藥物研制治愈疾病,人工智能可以和各種領(lǐng)域進(jìn)行排列組合。
當(dāng)然,人工智能必須在人類道德基準(zhǔn)范圍內(nèi)被開(kāi)發(fā)和利用。
我的理想就是讓AI科學(xué)成為可能。另外,我對(duì)人類的大腦運(yùn)作非常感興趣,開(kāi)發(fā)AI的同時(shí),我也了解自己的大腦運(yùn)作,例如大腦如何產(chǎn)生創(chuàng)意等,這個(gè)過(guò)程中我也更深入地了解了我自己。
哈薩比斯的青年傳奇人生:從研究海馬體開(kāi)始
“AlphaGo 之父”、DeepMind 的創(chuàng)始人,現(xiàn)年 40 歲的哈薩比斯如今應(yīng)成為了人工智能領(lǐng)域最為炙手可熱的明星,伴隨著 AlphaGo 的爆紅,這位被英國(guó)《衛(wèi)報(bào)》稱為是“人工智能英雄”的天才顯然已經(jīng)成為了 AI 的代名詞。
在 2014 年年初,他將自己當(dāng)時(shí)還名不見(jiàn)經(jīng)傳的倫敦初創(chuàng)公司 DeepMind 以 4 億英鎊(約合 6.5 億美元)的價(jià)格賣給了 Google,成為了迄今為止 Google 在歐洲范圍內(nèi)最大的一筆收購(gòu)。
在 2014 年的溫哥華 TED 大會(huì)上,Google 的執(zhí)行總裁拉里·佩奇(Larry Page)不僅對(duì)哈薩比斯贊不絕口,更將其公司的技術(shù)稱為“長(zhǎng)久以來(lái)我見(jiàn)過(guò)的最令人興奮的事件之一”。
哈薩比斯也表示,DeepMind 正在開(kāi)發(fā)一種面對(duì)幾乎任何問(wèn)題都能學(xué)習(xí)的人工智能軟件,這可以幫助人們處理一些世界上最為棘手的問(wèn)題。他說(shuō):“人工智能有巨大的潛力,它會(huì)讓人類大吃一驚?!?/span>
事實(shí)上,這位出生于 1976 年 7 月 27 日的知名 AI 科學(xué)家也是從小出名的“神童”。4 歲的時(shí)候,僅用兩個(gè)星期就國(guó)際象棋大賽中擊敗成年人;8 歲開(kāi)始接觸計(jì)算機(jī),用他從國(guó)際象棋比賽中贏的 200 英鎊買了人生中第一臺(tái)計(jì)算機(jī) ZX Spectrum;16 歲的時(shí)候被劍橋大學(xué)錄取;17 歲的時(shí)候就和別人共同制作了經(jīng)典模擬游戲“Theme Park”,并成立了自己的電子游戲公司。這樣的人生不可謂不傳奇。
但開(kāi)發(fā)計(jì)算機(jī)游戲限制了哈薩比斯踐行自己的真正的使命。最后,他決定,是時(shí)候該做一些以人工智能為首要任務(wù)的事情了。
在 2005 年,哈薩比斯開(kāi)始在倫敦大學(xué)學(xué)院進(jìn)修神經(jīng)系統(tǒng)科學(xué)博士學(xué)位,希望通過(guò)研究真正的大腦來(lái)發(fā)現(xiàn)對(duì)研究人工智能有用的線索。他選擇了海馬體做研究對(duì)象——海馬體主要負(fù)責(zé)記憶以及空間導(dǎo)向,至今人類對(duì)它的認(rèn)知還很少。哈薩比斯說(shuō):“我挑選的這些大腦區(qū)域的功能目前尚沒(méi)有好的運(yùn)算法則與之對(duì)應(yīng)?!?/span>
作為一個(gè)沒(méi)有學(xué)習(xí)過(guò)高中生物課程的計(jì)算機(jī)科學(xué)家和游戲企業(yè)家,哈薩比斯的表現(xiàn)超過(guò)了同一院系中的醫(yī)學(xué)博士和心理學(xué)家。他說(shuō):“我經(jīng)常開(kāi)玩笑說(shuō)我對(duì)大腦的唯一認(rèn)知是,它是在頭蓋骨里面的?!?/span>
但哈薩比斯很快就取得了成就。2007 年,他的一項(xiàng)研究被《科學(xué)》雜志評(píng)為“年度突破獎(jiǎng)(Breakthrough of the Year)”。在這項(xiàng)研究中,他發(fā)現(xiàn) 5 位失憶癥患者因?yàn)楹qR體受損而很難想象未來(lái)事件。從而證明了大腦中以往被認(rèn)為只與過(guò)去有關(guān)的部分對(duì)于規(guī)劃未來(lái)也至關(guān)重要。
發(fā)現(xiàn)了記憶與預(yù)先規(guī)劃的交錯(cuò)關(guān)系后,哈薩比斯進(jìn)入下一階段的冒險(xiǎn)――他在 2011 年終止了自己的博士研究,開(kāi)始創(chuàng)立以“解決智能”為經(jīng)營(yíng)理念的DeepMind 科技公司。
哈薩比斯與人工智能專家謝恩·萊格(Shane Legg)和連續(xù)創(chuàng)業(yè)家穆斯塔·法蘇萊曼(Mustafa Suleyman)一起創(chuàng)立了 DeepMind。公司雇用了機(jī)器學(xué)習(xí)方面的頂尖研究人員,并吸引到一些著名的投資者,包括彼得·泰爾(Peter Thiel)的 Founders Fund 公司、以及特斯拉和 SpaceX 的創(chuàng)始人埃隆·馬斯克(Elon Musk)。但 DeepMind 一直保持低調(diào),直到 2013 年 12 月,他們?cè)谝淮螛I(yè)界領(lǐng)先的機(jī)器學(xué)習(xí)研究大會(huì)上上演了自己的處子秀。
在太浩湖畔的哈拉斯賭場(chǎng)酒店里(Harrah’s Casino),DeepMind的研究人員演示的軟件令人驚艷。該軟件不僅可以玩雅達(dá)利的三款經(jīng)典游戲――乒乓、打磚塊和摩托大戰(zhàn),而且比任何人玩得都好。更關(guān)鍵的是,這款軟件并沒(méi)有獲得任何有關(guān)如何玩游戲的信息,提供給軟件的只有控制器、顯示器、得分規(guī)則,并告訴它盡可能得高分。程序通過(guò)不斷的試錯(cuò),最后成了專家級(jí)的玩家。
此前從未有人演示過(guò)具備這種能力的軟件,可以從零開(kāi)始學(xué)習(xí)和掌握如此復(fù)雜的任務(wù)。事實(shí)上,DeepMind利用了一種機(jī)器學(xué)習(xí)技術(shù)――深度學(xué)習(xí),這種技術(shù)通過(guò)模擬神經(jīng)元網(wǎng)絡(luò)來(lái)處理數(shù)據(jù)。但它將深度學(xué)習(xí)與其他技巧結(jié)合,達(dá)到了不可思議的智能水平。
加州大學(xué)的人工智能專家斯圖亞特·拉塞爾(Stuart Russell)教授表示:“人們有點(diǎn)震驚,因?yàn)樗麄儾⑽戳舷氲轿覀兡茉诂F(xiàn)階段技術(shù)水平下做到這種程度。我想,人們驚呆了吧?!?/span>
DeepMind 將深度學(xué)習(xí)與另一種叫做“強(qiáng)化學(xué)習(xí)”的技術(shù)相結(jié)合,強(qiáng)化學(xué)習(xí)的靈感來(lái)自于斯金納(B.F. Skinner)等動(dòng)物心理學(xué)家研究成果。它可以讓軟件通過(guò)在行動(dòng)后接收對(duì)行動(dòng)效果的反饋來(lái)學(xué)習(xí),人類和動(dòng)物通常都是這么做的。
人工智能研究人員對(duì)于強(qiáng)化學(xué)習(xí)的研究已有數(shù)十年了,但在 DeepMind 的 Atari 演示之前,還沒(méi)有人開(kāi)發(fā)出像這種能夠玩游戲的具備復(fù)雜學(xué)習(xí)能力的系統(tǒng)。哈薩比斯表示,其原因之一可能是他借鑒了在海馬體上面的發(fā)現(xiàn)。那款可以玩雅達(dá)利游戲的軟件學(xué)習(xí)過(guò)程就部分地牽涉到了不斷重放過(guò)去經(jīng)歷,以便深度和提取有關(guān)將來(lái)應(yīng)該怎么做的最精確提示。
哈薩比斯說(shuō):“我們知道大腦就是這樣工作的,人在睡覺(jué)的時(shí)候,海馬體會(huì)把一天的記憶重放給大腦皮層。”
一年之后,拉塞爾和其他研究人員仍對(duì) DeepMind 使用的技術(shù)和其他技巧究竟如何達(dá)到如此卓越的效果感到困惑不已,并且還苦苦思索這些技術(shù)的其他用途是什么。不過(guò) Google 卻沒(méi)有想那么久,在太浩湖演示一個(gè)月之后就宣布收購(gòu)這家公司。
哈薩比斯對(duì)于了解和創(chuàng)造人工智能的追求引領(lǐng)他經(jīng)歷了三個(gè)職業(yè)生涯:游戲開(kāi)發(fā)者、神經(jīng)系統(tǒng)科學(xué)家和人工智能企業(yè)家。
現(xiàn)在,哈薩比斯的身份雖然已經(jīng)轉(zhuǎn)變成了 Google DeepMind 的領(lǐng)導(dǎo)者,但他的 DeepMind 總部仍然位于倫敦,依舊把“解決智能”問(wèn)題當(dāng)作自己的使命宣言。加入 Google 時(shí),公司大概有 75 人,而現(xiàn)在已經(jīng)擴(kuò)展到了 400 余人。此外,DeepMind 還在Google 總部擁有一支小的團(tuán)隊(duì),主要負(fù)責(zé)將DeepMind 的技術(shù)應(yīng)用到 Google 的產(chǎn)品上。與此同時(shí),在加入Google后,哈薩比斯還和其他聯(lián)合創(chuàng)始人一起成立了Google AI 倫理委員會(huì)。
加入Google之后,DeepMind 的技術(shù)被用來(lái)改善 YouTube 的視頻推薦功能或Google的移動(dòng)語(yǔ)音搜索。哈薩比斯說(shuō):“很快,你就會(huì)看到我們的一些技術(shù)會(huì)嵌入到這類產(chǎn)品當(dāng)中。”
當(dāng)然,Google 并非是唯一相信 DeepMind 的方案能賺大錢的公司。哈薩比斯也因?yàn)槠涔ぷ饔锌赡芰钣?guó)經(jīng)濟(jì)受益而獲得了英國(guó)皇家學(xué)會(huì)的穆拉德獎(jiǎng)。
不過(guò)相比之下,在談到改進(jìn)現(xiàn)有產(chǎn)品的算法后還將做什么時(shí),哈薩比斯顯得更加興奮。2015 年,DeepMind 發(fā)表有關(guān)學(xué)習(xí)掌握 Atari 游戲的算法的論文,并登上了 Nature 雜志的封面。之后,哈薩比斯和他的團(tuán)隊(duì)又開(kāi)始把注意力轉(zhuǎn)移到圍棋這一古老而又復(fù)雜的中國(guó)游戲上。其復(fù)雜程度難以想象,AI 科學(xué)家們研究了幾十年一直無(wú)法突破。
但DeepMind 終于實(shí)現(xiàn)了突破,2016 年 3 月,DeepMind 讓它的圍棋算法 “AlphaGo” 和圍棋世界冠軍李世乭進(jìn)行了一場(chǎng)比賽。一共五局的比賽,DeepMind 贏了 4 局,最終取得勝利。
成功之后,哈薩比斯也獲得了無(wú)數(shù)贊譽(yù),包括今年 5 月份的“亞洲獎(jiǎng)”年度科技最佳貢獻(xiàn)獎(jiǎng),前一段時(shí)間被《時(shí)代》提名為全球最具影響力 100 人之一;2016 年被 Nature 雜志評(píng)為“年度十大人物”,等等。
也就是這樣一個(gè)技術(shù)驕子,他永遠(yuǎn)不會(huì)對(duì)現(xiàn)狀滿足。如今,他又帶領(lǐng)自己的智能機(jī)器來(lái)到中國(guó),試圖將人類智慧的最后尊嚴(yán)徹底打垮,信心所在,不可一世!
參考資料:
https://www.technologyreview.com/s/532876/googles-intelligence-designer/
http://uk.businessinsider.com/the-incredible-life-of-deepmind-cofounder-demis-hassabis-2017-5
https://en.wikipedia.org/wiki/Demis_Hassabis
https://www.ft.com/content/048f418c-2487-11e7-a34a-538b4cb30025
點(diǎn)擊圖片查看報(bào)名方式
聯(lián)系客服