Chat-GPT背后的明星企業(yè)OpenAI,始于幾個(gè)硅谷極客想要“拯救人類”的瘋狂念頭。
2014年,特斯拉正在為產(chǎn)能問題焦頭爛額,來中國(guó)求援的馬斯克順便做客央視《對(duì)話》欄目,遭到楊元慶靈魂拷問:2013年聯(lián)想一共賣出了1.15億臺(tái)設(shè)備,特斯拉賣了幾輛車?
同一時(shí)期的美國(guó),“AI取代人類”成為了硅谷new money的關(guān)鍵詞,這讓結(jié)過3次婚、生過10個(gè)孩子的馬斯克深感不安。谷歌創(chuàng)始人拉里·佩奇就曾批評(píng)馬斯克是一個(gè)“物種主義者”,不愿用“硅”創(chuàng)造新物種。
2015年夏天,馬斯克找到了他的知音——薩姆·阿爾特曼。
這位名字也能翻譯成“奧特曼”的帥哥,是創(chuàng)業(yè)孵化器Y Combinator的新任掌門,也是一個(gè)標(biāo)準(zhǔn)的科技狂,擁有兩家核聚變企業(yè)和一家區(qū)塊鏈公司。
2009年,YC創(chuàng)始人曾在博客上分享了過去30年最有趣的5位創(chuàng)始人,24歲的阿爾特曼與喬布斯、谷歌創(chuàng)始人、賽普拉斯半導(dǎo)體CEO和Gmail之父并列。
在一次私人聚會(huì)上,兩位明星企業(yè)家宣布掏出10億美元,籌備一家非盈利導(dǎo)向的AI實(shí)驗(yàn)室OpenAI,“讓人類以更接近于安全的方式構(gòu)建真正的AI”。
在Chat-GPT橫空出世之前,絕大多數(shù)人都不知道這家站在人類智商密度高地上的公司都做了些什么,到底花掉了多少錢。
這是一段用美元堆出來的理想主義故事。
OpenAI誕生的那場(chǎng)聚會(huì)上,馬斯克幾乎沒有招到人?,F(xiàn)場(chǎng)所有人都在追問一個(gè)問題:此時(shí)谷歌、Facebook、百度早已把世界上最頂尖的AI學(xué)者搜刮殆盡,你碰什么瓷呢?
這群野心家不肯死心,向蒙特利爾大學(xué)一位教授要來了一份10人挖角名單,上面寫著圈內(nèi)最有前途的年輕AI研究員。這其中最為重要的挖角對(duì)象,是一個(gè)名叫伊利亞·薩特斯基弗的俄羅斯人。
小薩是AI研究宗師杰夫·辛頓的學(xué)生。2012年,辛頓帶著27歲的小薩和另一個(gè)學(xué)生發(fā)明了一個(gè)AI模型,該模型識(shí)別圖像的準(zhǔn)確率高得嚇人,在學(xué)術(shù)界引起了轟動(dòng),也直接奠定了小薩產(chǎn)業(yè)泰斗的歷史地位。
這也讓谷歌等企業(yè)迅速意識(shí)到:AI終于有搞頭了,直接把小薩挖走了。
小薩的決定其實(shí)出于一個(gè)有些難以啟齒的“理想”:他想實(shí)現(xiàn)AGI(通用人工智能)。
所謂AGI,即“超級(jí)智能”,接近科幻電影中萬能的人工智能;與之形成對(duì)比的是人臉識(shí)別、翻譯、下圍棋等只能完成單一任務(wù)的人工智能。
即便2012年,杰夫·辛頓和小薩的論文讓AGI的可行性跨出了一大步,但以當(dāng)代的科研基礎(chǔ),談?wù)揂GI,依舊就像談?wù)撊绾伍L(zhǎng)生不老一樣民科。
科學(xué)家all in AGI,賭贏,可以在教科書里與比肩牛頓;賭輸,成為美版知乎Quaro的民科代表。
但企業(yè)all in AGI,大概只有一個(gè)結(jié)局——成為先烈。龐大的資本支出,讓無論是相信“專家算法”的IBM,還是“深度學(xué)習(xí)”神教的谷歌、百度,無論信奉何種AI路線,巨頭們的一切AI研究,都為產(chǎn)業(yè)化服務(wù)。
愿意成為這個(gè)冤大頭的,只有OpenAI一家。
阿爾特曼將OpenAI打造成了一個(gè)象牙塔:在實(shí)驗(yàn)室成立的前15個(gè)月,OpenAI都沒一個(gè)明確的研究目標(biāo)。平日里,馬斯克便帶著這群夢(mèng)想家一起腦暴,探討AGI將如何實(shí)現(xiàn)。
2016年5月,時(shí)任谷歌首席AI研究員曾參觀過OpenAI,對(duì)其工作方式相當(dāng)困惑。他詢問OpenAI的目標(biāo)是什么,沒想到難倒了OpenAI,“我們現(xiàn)在的目標(biāo),就是....做點(diǎn)好事[3]?!?/span>
然而在數(shù)月之后,這位研究員卻毅然辭職加入了OpenAI——一起做點(diǎn)好事。
畢竟在當(dāng)時(shí)的硅谷,“放肆做夢(mèng)”是個(gè)極其稀缺的特質(zhì)。哪怕是AGI曾經(jīng)的布道者DeepMind,在被谷歌收購(gòu)后也更實(shí)際了些。產(chǎn)業(yè)界與學(xué)術(shù)界的差異,促使了大批科學(xué)家的“叛逃”:
從2017年開始,吳恩達(dá)、李飛飛等著名AI學(xué)者先后回歸大學(xué)校園。
此般大環(huán)境下,高舉理想主義大旗的OpenAI,成功抄到了歷史的大底,拉攏了不少頂尖人才。
2017年3月,隨著團(tuán)隊(duì)越來越龐大,阿爾特曼決定給OpenAI設(shè)立一個(gè)更具體的目標(biāo),這時(shí),等待他們的是一個(gè)好消息與一個(gè)壞消息。
2017年是OpenAI命運(yùn)的分水嶺。
好消息是,谷歌幫OpenAI解決了沒有具體目標(biāo)的困擾。2017年,谷歌在一篇論文中開源了“Transformer神經(jīng)網(wǎng)絡(luò)架構(gòu)”。它的革命性在于可以讓AI“聽懂人話”,而這很可能會(huì)是通往AGI的關(guān)鍵鑰匙。
一直在做好事的OpenAI,瞬間有了攻堅(jiān)的方向。
壞消息則是,沒錢攻堅(jiān)了。
一個(gè)熱知識(shí)是,如果沒一個(gè)出手闊綽的靠山,根本沒資格搞AI。光算力——也就是芯片的開銷,就是一筆巨額成本。從2012年的AlexNet模型到2017年的AlphaGoZero,算力消耗足足翻了30萬倍。同期英偉達(dá)股價(jià)翻了整整15倍,黃仁勛做夢(mèng)笑醒好幾回。
早些年,一大批科學(xué)家紛紛跳槽去硅谷巨頭,就是為了找靠山。2010年,還在斯坦福的吳恩達(dá)研究出一套新算法,卻發(fā)現(xiàn)大學(xué)的算力條件遠(yuǎn)遠(yuǎn)不夠。他從美國(guó)東海岸找到西海岸,發(fā)現(xiàn)只有谷歌符合條件。
2017年,Transformer橫空出世后,AI進(jìn)入大模型階段。所謂大模型,背后支撐的是大算力、大數(shù)據(jù)以及大算法,而這也意味著燒大錢。
以O(shè)penAI的GPT-3模型為例,有機(jī)構(gòu)做過測(cè)算,發(fā)現(xiàn)訓(xùn)練一個(gè)GPT-3,需要至少1024張A100顯卡持續(xù)運(yùn)轉(zhuǎn)足足一個(gè)月[7]。而A100顯卡最便宜的版本也要8769美元。
也就是說,什么還沒算,就先給英偉達(dá)交了900萬美元入場(chǎng)費(fèi),這還沒算搭建機(jī)房的成本和后續(xù)源源不斷的電費(fèi)。
如今,ChatGPT訓(xùn)練一次的成本高達(dá)1千萬美元,這是一般企業(yè)無法承受的。小冰公司CEO李笛算過一筆賬:“如果按照ChatGPT成本來考量的話,每天我要燒3億人民幣,一年要燒一千多億?!?/span>
回到2017年,仍是非盈利機(jī)構(gòu)的OpenAI,根本無力負(fù)擔(dān)這些費(fèi)用。原本的大靠山馬斯克也在2018年初宣布辭職,原因是避免與特斯拉AI業(yè)務(wù)有所沖突。
風(fēng)雨飄搖之際,阿爾特曼悄悄修改了OpenAI“非盈利”的使命,開始給OpenAI另謀靠山。
此時(shí),既無科研成果,又無大牛坐鎮(zhèn)的微軟,進(jìn)入了阿爾特曼的視野。
作為美國(guó)高科技領(lǐng)域老牌列強(qiáng),微軟在AI上的決心不可謂不強(qiáng),但長(zhǎng)期被谷歌的DeepMind來回摩擦。
2019年,恨鐵不成鋼的微軟遇見人才濟(jì)濟(jì)的OpenAI。當(dāng)時(shí),比爾·蓋茨本人并不相信OpenAI會(huì)成功——投資談判中,他很直白地對(duì)其發(fā)展路線表達(dá)了悲觀,認(rèn)為Transformer這類大語言模型在過去五年都沒什么進(jìn)展,沒人知道它會(huì)有什么價(jià)值。
但話雖如此,微軟還是爽快的掏出了10億美元。
這次接盤,很可能會(huì)成為微軟歷史上最成功的一筆抄底。
2022年12月,OpenAI沿著Transformer路線開發(fā)出了最新款A(yù)I,名為Chat-GPT。2個(gè)月后,Chat-GPT的全球月活突破了1億。
這回,該輪到谷歌睡不著覺了。
Chat-GPT登上熱搜之后,公眾常常會(huì)討論一個(gè)問題:為什么又在美國(guó)?
事實(shí)上,復(fù)刻一個(gè)Chat-GPT并非難事。Chat-GPT的本質(zhì),其實(shí)以GPT-3模型為框架,通過“對(duì)話”這一場(chǎng)景,搭建了一個(gè)普通用戶也能使用的AI應(yīng)用,兩者之間的技術(shù)進(jìn)步并不算大。
如果翻一翻前兩年的新聞能發(fā)現(xiàn),早在GPT-3時(shí)代,中國(guó)公司已經(jīng)在如法炮制,大可不必對(duì)各種中國(guó)版Chat-GPT冷嘲熱諷。在純粹的技術(shù)層面,中國(guó)企業(yè)落后的并不太多。
我們回到一開始,大模型發(fā)展的三要素:算法、算力、數(shù)據(jù)。
算法,如同人類大腦,決定了AI的學(xué)習(xí)能力。
一個(gè)業(yè)內(nèi)主流觀點(diǎn)是,盡管沒有率先做出來Transformer、GPT-3,但國(guó)內(nèi)企業(yè)在大模型上的技術(shù),距離ChatGPT的差距其實(shí)也僅在半年到兩年之間。
比如GPT-3發(fā)布之后,百度、騰訊、阿里等企業(yè)諸如一言、M6、混元等十萬億參數(shù)級(jí)別的大模型也很快跟進(jìn)。
算力,這意味著一種資源,決定了算法的運(yùn)行效率。
AI訓(xùn)練高度依賴英偉達(dá)A100、H100等AI專用顯卡。常見的消費(fèi)級(jí)顯卡通常會(huì)將部分算力讓渡于光追等功能,相比之下,A100的特點(diǎn)則是從硬件設(shè)計(jì)到軟件配套 all in AI。
盡管從2022年開始,美國(guó)已經(jīng)限制英偉達(dá)向中國(guó)大陸銷售A100/H100顯卡,但很快英偉達(dá)也推出了A800,成為中國(guó)特供版A100平替。
數(shù)據(jù),訓(xùn)練算法的優(yōu)質(zhì)教材,決定了AI會(huì)學(xué)到哪些知識(shí)。
站在OpenAI背后的,是一座數(shù)據(jù)富礦,即豐富的高質(zhì)量英文文本數(shù)據(jù)。例如在全球最大的百科網(wǎng)站維基百科上,擁有最多百科文章的語言正是英文。
除此之外,英文互聯(lián)網(wǎng)還有眾多類似Github這樣的專業(yè)論壇、海量的圖書、學(xué)術(shù)論文、專業(yè)新聞等數(shù)據(jù)。盡管,中文互聯(lián)網(wǎng)的文本質(zhì)量有待提升,但數(shù)據(jù)總量卻是碾壓級(jí)別的優(yōu)勢(shì)。
無論是算法的調(diào)教,還是算力的堆積,本質(zhì)都是砸錢砸人。在這方面,中國(guó)其實(shí)并不落后于美國(guó)。正如百米賽跑中,冠軍和亞軍的差距往往不到一秒鐘。
然而不到一秒鐘的差距,卻決定了鮮花與掌聲的歸屬,這可能也是Chat-GPT和“中國(guó)版Chat-GPT”的差別。
OpenAI的誕生似乎離不開無數(shù)偶然的堆積,但也有著同樣多的必然?!霸旄H祟悺钡腁GI神教,聚集了世界上最有才華的青年AI學(xué)者;適時(shí)出現(xiàn)的技術(shù)突破讓OpenAI的路徑有跡可循,微軟的出現(xiàn)組成了最后一塊拼圖。
Chat-GPT的昂貴之處,既在于天文數(shù)字的投資和令人心生畏懼的燒錢速度,也在于一個(gè)能夠包容瘋狂想法的商業(yè)環(huán)境。正如阿爾特曼所說:
成千上萬的創(chuàng)業(yè)公司在做社交軟件,只有不到20家公司致力于核聚變。然而偉大的事情實(shí)際上更容易,因?yàn)轱w向太空是每一個(gè)人的夢(mèng)想。
夢(mèng)想并不昂貴,但敢于夢(mèng)想的勇氣卻是一件奢侈品。
[1] 深度學(xué)習(xí)革命,凱德·梅茨
[2]Why Elon Musk fears artificial intelligence,Vox
[3] SAM ALTMAN’S MANIFEST DESTINY,The NewYorker
[4] Inside OpenAI, Elon Musk's Wild Plan to Set Artificial Intelligence Free,Wired
[5] The messy, secretive reality behind OpenAI’s bid to save the world,MIT Technology Review
[6] AI的十年熬贏往事,Tech對(duì)角線
[7]淺談ChatGPT工作的底層邏輯
[8] How Microsoft’s Stumbles Led to Its OpenAI Alliance,The Information
[9] 中國(guó)如何缺席ChatGPT盛宴,紅博士說
聯(lián)系客服