在山姆·奧特曼(Sam Altman)眼中,AI是一個可以孵化出無數(shù)工具,推動各行各業(yè)前進的基礎平臺。AI 大模型技術,將成為繼移動互聯(lián)網(wǎng)之后,未來最大的技術平臺;而以聊天機器人為界面,加上圖像、音樂、文本等多模態(tài)模型的發(fā)展,將誕生大型企業(yè)。以下,Enjoy:
生成式 AI 的爆火,讓硅谷的錢尋找到了新方向。Open AI 去年先后推出的繪畫模型 DALL- E 和對話機器人 ChatGPT,成為了 AIGC 浪潮中的引領者。
前不久,微軟決定向 OpenAI 投資數(shù)十億美元,新一輪投資也讓其估值達到 290 億美元。似乎又回到了上一次 AI 給人們帶來無限想象的時候。
OpenAI 的創(chuàng)始人奧特曼,則成為了這次 AI 新浪潮絕對的代言人。
OpenAI 創(chuàng)始人Sam Altman
如果要舉出當下離 AI 技術革命最近的人,山姆·奧特曼(Sam Altman)必然是其中之一。
2017 年,他在 Medium 上寫道「我們已經(jīng)來到同進化的階段ーーAI 的影響、作用并感染我們,我們改進 AI」。那時候,他仍擔任創(chuàng)業(yè)孵化器 Y Combinator 的總裁,并和伊隆·馬斯克、彼得?蒂爾、雷德?霍夫曼等人一起投資了 10 億美元,共同成為 OpenAI 的創(chuàng)始人。
又過了兩年,他將工作重心轉移到了 AI,擔任 OpenAI 的 CEO 直到今天。
去年秋季,投資機構格雷洛克(Greylock) 舉行了一次 AI 主題峰會。在一場與 Open AI 創(chuàng)始人之一的老友雷德?霍夫曼,以及在座觀眾的交流中,奧特曼分享了對于未來的預測:AI 大模型技術,將成為繼移動互聯(lián)網(wǎng)之后,未來最大的技術平臺;而以聊天機器人為界面,加上圖像、音樂、文本等多模態(tài)模型的發(fā)展,將誕生大型企業(yè)。
甚至有一些更激進的預測,比如AI 科學家將學會自我迭代,它不僅僅降本增效,而是為人類帶來新知,增加人類知識的總和。不過如果了解他早些時候的想法,便會覺得這樣的預測并不出乎意料,他曾說,人類以超群的智力為傲,或許在 AI 看來,「我們和黑猩猩之間的差異幾乎不值一提?!?/p>
他形容「我們正處在AI的懸崖邊上」,他感到巨大的驚喜和危險都近在咫尺。不過,堅信科技的發(fā)展會帶來人類進步和經(jīng)濟增長的他,選擇保持樂觀,為一個更美好的未來努力。
這是當天對話主要內容的編譯,提問有些來自雷德?霍夫曼,有些來自現(xiàn)場觀眾,不再單獨標出。
雷德?霍夫曼與奧特曼在活動現(xiàn)場
1
大模型——新的技術平臺
Q:很多大模型都通過API(application programming interface,應用接口)開放使用,它真正的商業(yè)機會是什么?
A:現(xiàn)在,語言模型已經(jīng)可以很好地應用到文案寫作和教育服務領域。我相信未來幾年內,語言模型會更加強大,將能與Google這一價值萬億美元的搜索產(chǎn)品一較高下。語言模型的應用將會改變我們的日常生活。
以前,人們太早嘲笑許多趨勢,比如聊天機器人,其實它很有價值,只是當時的技術還不能滿足需求?,F(xiàn)在的聊天機器人更加成熟,幾乎可以達到人類水平。聊天機器人可以用于醫(yī)療服務行業(yè),提供咨詢和教育服務,這方面將能催生出大型企業(yè)。
我相信,不久之后會出現(xiàn)多模態(tài)模型,這將開辟新的事物?,F(xiàn)在,人們可以直接用自然語言命令計算機為你完成你想做的工作,例如DALL-E圖像生成工具和Copilot編程工具,都是用戶向它們輸入自然語言描述,然后工具自動生成用戶想要的東西,用戶還可以不斷迭代修改自己的描述,直至工具給出滿意的輸出。
類似的AI應用方式會成為大趨勢,可以孕育出許多大型企業(yè)。強大的AI模型可以成為孵化各種AI應用的平臺,就像智能手機的出現(xiàn)催生出眾多APP一樣,它們的共同點都是可以制造無數(shù)的商業(yè)機會。
Q:作為大型語言模型 API 的服務提供商,關鍵是什么?如何創(chuàng)建一個持久的差異化業(yè)務?
A:將來應該會出現(xiàn)幾個大型的基礎模型,開發(fā)人員都將基于這些基礎模型研發(fā)AI應用。但目前的情況依然是某一家公司開發(fā)出一個大型語言模型,然后開放API供他人使用。
我認為,將來在基礎模型和具體AI應用研發(fā)之間會有一個中間層:出現(xiàn)一批專門負責調整大型模型以適應具體AI應用需求的初創(chuàng)企業(yè)。能做好這一點的初創(chuàng)公司將會非常成功,但這取決于它們能在「數(shù)據(jù)飛輪」上走多遠。
數(shù)據(jù)飛輪:使用更多數(shù)據(jù)可以訓練出更好的模型,吸引更多用戶,從而產(chǎn)生更多用戶數(shù)據(jù)用于訓練,形成良性循環(huán)。
我對初創(chuàng)企業(yè)訓練模型的能力持懷疑態(tài)度,將來承擔模型訓練角色的應該不會是初創(chuàng)公司,但這些企業(yè)可以在上述的中間層角色中發(fā)揮巨大價值。我認為中間那一層會創(chuàng)造很多價值。
Q:一個大型語言模型初創(chuàng)企業(yè),如何區(qū)別于另一個大型語言模型初創(chuàng)企業(yè)呢?
A:我覺得應該是中間層。從某種意義而言,創(chuàng)業(yè)公司會訓練自己的模型,只不過不是從頭開始。他們將采用基礎模型,這些模型已經(jīng)經(jīng)過大量的計算和數(shù)據(jù)訓練,然后在這些模型之上進行訓練,為每個垂類創(chuàng)建模型。
他們所做的 1% 的訓練,對于應用來說至關重要。我認為,這些創(chuàng)業(yè)公司將會非常成功,并且與眾不同??赡馨ㄒ欢螘r間內存在的prompt engineering(提示工程)或基礎核心模型(core base model)。
注:提示工程是指將任務的描述、或者提問放在輸入中,讓 AI 模型輸出理想結果的調試過程;ChatGPT 走紅之后,提示工程師這一崗位也被人所關注。
Q:五年內,大多數(shù)用戶與基礎模型交互的方式是什么?prompt engineering 將是許多組織的內部職能嗎?
A:我不認為五年后我們還做 prompt engineering,這將被整合進所有地方。無論用文本還是語音,取決于上下文,只需要語言接口,讓計算機做你想做的任何事情。
將來的AI系統(tǒng)不會因為增補了某個特定詞就會產(chǎn)生截然不同的輸出,而是可以較好地理解自然語言,用戶只需以文本和語音形式輸入指令,即可讓計算機完成圖像生成、資料研究、心理咨詢等復雜任務。
總的來說,用戶只需使用自然語言就可以與計算機交互,當然,如果藝術家能想出更有創(chuàng)造性的描述,也自然就可以生成更好的圖像。
Q:當有一個偉大的視覺思考者,他們可以從 DALL-E 中獲取更多,因為他們知道如何更深入思考,知道如何在測試中迭代循環(huán)。你認為這是大部分這類事的普遍真理嗎?
A:百分百確定。重要的是思想的質量,和對你想要的東西的理解。所以藝術家仍然會在圖像生成方面做得最好,不是因為他們在圖像最后加上了這個神奇單詞,而是因為他們能用我沒有的創(chuàng)造性的眼光來表達。
DALL-E2 生成的作品|來源:kasendorf
Q:最令你驚訝的是什么?如果沒有意識到事情已經(jīng)發(fā)展到這一步,你認為會有什么樣的驚喜呢?
A:人們現(xiàn)在所犯的最大的系統(tǒng)性錯誤,就是他們會說,「好吧,我也許持懷疑態(tài)度,但是這種語言模型真的會起作用,當然,圖像和視頻也會起作用。但它不會為人類產(chǎn)生新知。它只會做其他人已經(jīng)做過的事情。這還是讓智力的邊際成本非常低,不能治愈癌癥。它不會增加人類科學知識的總和?!?strong>我認為這將被證明是錯誤的,讓目前該領域的專家最感到驚訝的地方。
2
當 AI 科學家可以自我迭代
Q:無論是建立在 API 之上,還是科學家使用 API,有哪些地方的科學會加速,以及如何加速?
A:現(xiàn)在科學界對AI的應用分為兩種,一種是將AI工具直接用于科學目的,如AlphaFold(用于蛋白質結構預測),它們可以創(chuàng)造巨大價值,相信未來會出現(xiàn)無數(shù)這樣的工具。
另一種是將AI工具用于提升科研工作效率,如幫科學家和工程師找到新研究方向、寫代碼等。Copilot編程工具就是一個例子。但AI工具的能力遠不止于此。上述兩種AI應用將會大大推動科技前進。
此外,目前科學界也在探索對AI的第三種應用方式——讓AI成為可以「自我改進」的科學家。這件事情既有好處也有風險。
好的一面是,可以利用AI將人類的工作內容自動化,教會AI做任何人類可以做的事情:探索新科學、提出理論解釋、驗證、思考等,或許還可借此解決困擾人類已久的「AI對齊問題(Alignment Problem)」(即如何讓AI系統(tǒng)的目標符合人類的價值觀)。風險在于,有人擔心懂得「自我改進」的AI有可能會像科幻小說描寫的那樣,擅自改動代碼或修改優(yōu)化算法。
我深信,真正有利于促進人類和經(jīng)濟的前行的,是一個能夠推動科學進步的社會架構。我們能從這樣的社會架構中獲益很多。
Q:「對齊問題」可能值得解釋一下?
A:建立一個非常強大的系統(tǒng),如果它不按我們的意愿行事,或者它的目標與我們的沖突,就會變得非常糟糕。
因此,對齊問題是:我們如何建立做最符合人類利益事情的 AGI(Artificial General Intelligence 通用人工智能)?如何確保人類能夠決定人類的未來?
我們如何避免意外和故意誤用,前者是沒有預料到的錯誤,后者是一個壞人使用 AGI 造成巨大傷害;內在而言的對齊問題是,如果這個東西變成一個生物,視我們?yōu)橥{怎么辦?
我們對如何在小范圍內解決對齊問題有一些想法,已經(jīng)能夠使 OpenAI 最大的模型(表現(xiàn)得)比想象的要好。我們對下一步做什么有些想法,但不能誠實地看著任何人的眼睛說,看到了 100 年后將如何解決這個問題。但是,一旦人工智能足夠好,我們可以問它,「嘿,你能幫助我們做對齊研究嗎?」這將是工具箱里的一個新工具。
Q:我們之前的一次談話是,能不能告訴 agent(注:AI 中的一個概念,通常指環(huán)境中的智能主體),「不要種族歧視」?
A:當然。一旦模型變得足夠聰明,真正理解了種族主義是什么樣子,以及它有多復雜,你就可以說,「不要成為種族主義者?!?/p>
Q:「AGI」這個術語已經(jīng)被廣泛使用。有時困惑來自于人們對 AGI 有不同定義。你如何定義 AGI,怎樣知道我們什么時候實現(xiàn)它?
A:我理解的AGI相當于一個可以共事的普通人,任何遠程同事可以通過電腦幫你完成的工作,AGI也可以做,包括讓AGI學習醫(yī)療知識和寫代碼等等。
AGI的重點不在于掌握某一種難得的技能,而是擁有學習的元能力,然后只要人類需要,它就可以往任何技能方向發(fā)展并精通。另一個概念是「超級智能」(Super Intelligence),它指的是比全人類加起來還要聰明的智能。
Q:如何看待像 GPT-3 這樣的基礎技術,對生命科學研究進度的具體影響?生命科學研究中速率限制的因素是什么?我們無法超越這個限制,因為自然法則就是這樣?
A:目前的可用模型還不夠好,不足以對生命科學領域產(chǎn)生重大影響——不少生命科學家了解這些模型之后都說,它們只能在部分情況下發(fā)揮些許作用。AI在基因組學領域有一些很有前景的應用方向,但目前尚屬起步階段,不過我很看好。我認為這也是市值千億的巨頭準備進軍的領域之一。
如果AI未來真的可以讓醫(yī)藥公司的研發(fā)速率提高幾百倍,那無疑會產(chǎn)生深遠的影響。不過如你所說,生物學的自有規(guī)律仍在,新藥的臨床驗證需要時間,這也是醫(yī)藥研發(fā)的速率限制因素。
據(jù)我所知,不少合成生物公司借助AI發(fā)現(xiàn)許多新的研發(fā)想法,加快自己的研發(fā)迭代周期,但研發(fā)出來之后終究是要進行測試,這部分時間無法縮減。
我認為,醫(yī)藥初創(chuàng)公司最重要的是低成本和快速的研發(fā)周期,有了這兩點就有資本參與市場競爭了。所以如果我是一家醫(yī)藥初創(chuàng)公司的決策者,一開始我不會選擇從心臟病這類大難題下手。此外,如果我是一家AI藥物研發(fā)初創(chuàng)公司,我會在模擬器上多下工夫,因為目前這方面還亟待改善。
分子效果圖|來源:ANIRUDH on Unsplash
3
未來十年:
當成本的結構發(fā)生變化
Q:你認為登月計劃(指 AI 的進化)在未來幾年中有什么值得人們關注的地方?
A:一個比較確定的方向是,語言模型的發(fā)展會遠超今天的想象。雖然很多人都說算力和數(shù)據(jù)都已經(jīng)跟不上了,這也是事實,但算法的改進空間依然很大,還可以帶來很大的進步。
第二個方向是多模態(tài)模型的發(fā)展。未來的多模態(tài)模型將不局限于文本和圖像的互相轉換,而是所有模態(tài)之間都可以方便地互相轉化。
第三個方向是,模型可以持續(xù)學習。目前的模型如GPT都停滯在當初訓練好的狀態(tài),并不會隨著使用次數(shù)的增加而自我優(yōu)化。我相信未來可以改變這一點。
如果上述三點都能實現(xiàn)的話,我們就可以解鎖無數(shù)全新的應用場景,實現(xiàn)真正的科技革新,幫助人類實現(xiàn)科技的飛躍式前進。而且我相信,我們也有辦法利用AI推動科研進步和新知識的產(chǎn)生。
我認為,現(xiàn)在普遍存在的一種錯誤觀點是:「雖然語言模型的功能已經(jīng)比較完善,還可以應用到圖像和視頻領域,將應用智能的邊際成本降得非常低,但歸根結底,它只是模仿人類做過的東西,不能為人類產(chǎn)生新知識,不能治療癌癥,也不能拓展人類已知的科學領域。」我相信,AI的發(fā)展會讓持這種觀點的人大吃一驚。
Q:談一談目前被廣泛討論的領域,例如,AI 和核聚變。
A:業(yè)內有人正在研究利用強化學習模型控制核聚變反應,但據(jù)我們所知,AI模型在這里發(fā)揮的作用還非常有限。
一件不幸的事情是,AI 已經(jīng)成為一個流行詞(buzzword),這通常是個很糟糕的跡象。我希望這并不意味著這個領域即將分崩離析。但從歷史上來看,這對于新的創(chuàng)業(yè)公司來說是一個非常糟糕的信號。我認為這是個人們會說一切都是「這個加上 AI」的領域,很多事情都是真的。我確實認為這將是這一代最大的技術平臺。
我們喜歡在前沿領域做預測,預測和理解規(guī)模理論(scaling laws)是怎樣的(或是研究之后),然后說「好,這個新事物將發(fā)揮作用,就根據(jù)種方式來預測推演?!?/p>
這也是OpenAI的運作模式——先做擺在我們面前的最有信心能成功的事情,然后分出10%的資源進行成功確定性更低的探索工作。這種運作方式為我們帶來巨大的成功。
現(xiàn)階段不應該把重點放在「讓AI無所不能」上,而是先沿著現(xiàn)有的道路慢慢發(fā)展完善AI,然后留有開放探索的空間——偉大的事物都不是計劃出來的,有時重大的突破誕生于偶然。
Q:AI 應用在非常重要的系統(tǒng),例如金融市場,將會發(fā)生什么?
A:AI終將滲入人類生活的方方面面。未來十年里,智能和能源的邊際成本會迅速下降,趨近于零,而智能和能源又是其他各行各業(yè)的主要成本來源(當然,奢侈品除外)。
整個社會的成本結構都會下降,正如之前多次科技革命的結果一樣。在這種浪潮之下,很少有什么會一成不變。但有一點很重要,智能和能源成本只是趨近于零,而不是直接降為零。所以將來如果有人仍愿意花費巨額投資來購買智能和能源,他們得到的算力和能源的數(shù)量將突破想象。
設想一下,將來的能源使用成本下降10~100倍,智能使用成本下降1億倍,而對能源和智能的資金投入則比現(xiàn)在多1000倍,那會是什么樣的局面?
Q:AI 可以為人類創(chuàng)造者提供工具,拓展創(chuàng)造力。那么,讓創(chuàng)造者更有生產(chǎn)力AI 用創(chuàng)造力自己去做每件事的界限是什么?
A:至少目前看到的不是取代,主要是增強。在某些情況下,它正在取代。但對于這些領域的人們想從事的大多數(shù)工作來說,它是增強。這種趨勢將持續(xù)很長一段時間。可能展望 100 年,它可以完成整個創(chuàng)造性工作。
我覺得有意思的是,如果 10 年前問人們,AI 將如怎樣帶來影響,多數(shù)人會很有信心地說,首先它將取代工廠的藍領工作,卡車司機等,然后將取代低技能的白領工作,然后是高技能、高智商的白領工作,比如程序員。也許永遠不會取代那些創(chuàng)造性的工作?,F(xiàn)在的發(fā)展正好相反。
這說明預測未來是多么困難。這也說明人類可能不夠了解自己,不清楚什么類型的技能最難、最需要調動大腦,或者錯誤估計了控制身體的難度。
Q:你認為 AI 不會改變生活的哪些方面?
A:所有深層生物學的東西。我們仍然會真正關心與他人的互動,仍然會享受樂趣,大腦的獎勵系統(tǒng)仍然會以同樣的方式工作。我們仍然會有同樣的動力去創(chuàng)造新事物,為愚蠢的地位競爭,去組建家庭等。五萬年前人類在意的東西,一百年后的人類也會在意。
《銀翼殺手2049》劇照 |圖片來源:豆瓣
Q:在未來的 20 到 30 年里,隨著人工智能的不斷發(fā)展,會出現(xiàn)主要的社會問題嗎?我們今天能做什么來緩解這些問題?
A:AI的應用會極大影響經(jīng)濟活動。將來我們需要形成新的社會契約,考慮如何公平地分配財富。AGI系統(tǒng)的使用權將會成為一種商品,所以也要考慮如何讓所有人平等地獲得使用AGI的機會。還有AGI的管理問題:人類如何共同決定AGI可以做什么、不能做什么。
我不擔心「AI取代人類的工作之后,人類何去何從」的問題,雖然未來人類的工作會和現(xiàn)在很不一樣,但我覺得人類最終都會找到自己滿意的事業(yè),過上充實的生活。真正的難題是財富分配、AGI使用權和AGI的治理問題。
我們進行了世界上最大的 UBI 實驗(Unconditional Basic Income,無條件基本收入)。五年計劃還剩下一年零四分之一的時間。這不是唯一的解決辦法,但我認為這是一件偉大的事情。應該再嘗試 10 件這樣的事情。我們還嘗試了不同的方法,從我們認為將受到最大影響的群體那里獲得意見,并看如何在周期的早期階段行動。最近我們探索了如何將這項技術用來重新培訓那些早期將受到影響的人,也會嘗試做更多這樣的事情。
注:無條件基本收入UBI,指沒有條件、沒有資格審查,公民可以定期領取由政府或特定組織給予的一筆資金。
4
One more thing
我想,沒人知道我們正處在 AI 的懸崖邊上。人們會說「要么會很棒,要么會很糟糕」,你得做最壞的打算。說一切都會好起來,這并不是一個策略。不過你可能會有某種感覺:我們將到達一個美好的未來,并且盡所能的努力工作,為之奮斗,而不是一直從充滿恐懼和絕望的地方采取行動。
翻譯:OneFlow(ID: OneFlowTechnology)、極客公園(ID: geekpark)
譯者:胡燕君、賈川、凌梓郡、靖宇
參考鏈接:
https://greylock.com/greymatter/sam-altman-ai-for-the-next-era/
https://moores.samaltman.com/
https://medium.com/wordsthatmatter/merge-now-430c6d89d1fe
https://www.youtube.com/watch?v=WHoWGNQRXb0
聯(lián)系客服