搜狗創(chuàng)始人王小川,攜舊部在2023年高調(diào)“卷土重來”。
一年過后,背負(fù)著年底前“做出國內(nèi)最好的大模型”的KPI,王小川交了一份初期答卷。
2024年春節(jié)期間,王小川發(fā)布了自己的龍年愿景,他表示:“與互聯(lián)網(wǎng)時代的應(yīng)用相比,大模型時代的應(yīng)用將是一個新物種。以前我們更多的是造工具,但現(xiàn)在,我們造的新物種,更像一個人類的伙伴,人類對伙伴的要求,不會要求它像工具一樣精確,更希望讓它與人類合作?!?/p>
2024年1月29日,王小川創(chuàng)辦的大模型公司百川智能,發(fā)布了超千億參數(shù)的大語言模型Baichuan 3。百川方面強調(diào),在多個權(quán)威通用能力評測中,Baichuan 3都展現(xiàn)了出色的能力,尤其在中文任務(wù)上更是超越了GPT-4。
百川智能也在一年之間估值就超10億美元,成為國內(nèi)估值增長最快的大模型創(chuàng)業(yè)之一。對王小川來說,當(dāng)初因搜狗賣身騰訊,而沒能做成的事終于在這里得到了延續(xù)。
王小川“不甘心”。正如他在創(chuàng)辦百川智能時所說:“搜狗未盡的使命,在機器掌握了語言后終于可以實現(xiàn)了?!?/p>
01、完成“搜狗未竟的使命”
事情還得回到2023年4月,沉寂兩年的王小川,在位于清華大學(xué)東門外十字路口的搜狐網(wǎng)絡(luò)大廈,召開了一場媒體見面會,宣布與前搜狗COO茹立云聯(lián)合成立大模型創(chuàng)業(yè)公司百川智能,并拿到了5000萬美元的啟動資金。
搜狐網(wǎng)絡(luò)大廈曾是搜狗的大本營,王小川可謂“舊地重游”。當(dāng)時,這里匯聚了AI創(chuàng)業(yè)的群星,美團(tuán)聯(lián)合創(chuàng)始人王慧文成立的大模型公司——光年之外,辦公地點就選在這里;估值目前已超百億元的智譜AI,也在樓里安營扎寨。巧合的是,這三家公司的管理者,都是師出清華的同門。
正當(dāng)不少人以為王小川要就此上演“歸來記”時,他卻笑言“不跟他們在這里卷”,最終帶隊轉(zhuǎn)戰(zhàn)到了搜狐對面的大廈,雙方一路之隔。
畢竟,王小川雖然起家于搜狐,但這里也留下了他的遺憾?,F(xiàn)在,他要來完成自己的技術(shù)理想了。
在2023年ChatGPT剛剛變得火熱時,王小川就按捺不住,激動地發(fā)了一條朋友圈:“OpenAI的勝利,是技術(shù)理想主義的勝利。”
互聯(lián)網(wǎng)圈一直津津樂道的,是當(dāng)年“天才少年”王小川在搜狐十幾個月就干出了搜狗搜索,后來拿出了“瀏覽器+輸入法+搜索”的“三級火箭”方法論,并在馬云、馬化騰、周鴻祎、張朝陽等大佬中游走,一番合縱連橫,推動搜狗獨立在紐交所上市的故事。
但實際上,王小川一直念茲在茲的是一個基于AI的技術(shù)夢。
在他看來,搜索引擎的意義重大。它是能夠改變?nèi)藗兓臃绞?、進(jìn)而改變互聯(lián)網(wǎng)世界的力量。而人工智能和搜索,是天然聯(lián)系在一起的,搜索引擎本身就能對海量的數(shù)據(jù)進(jìn)行處理和匹配,這就是AI。
王小川是個執(zhí)著的人。每次搜狗的發(fā)布會,他都在侃侃而談技術(shù)。2016年他就說,搜索的未來是人工智能時代的明珠。那時有人問他搜狗為什么要轉(zhuǎn)型做AI,他當(dāng)時不好發(fā)作,但直到一年后他提起來,還憤憤不平地說,自己聽完“一肚子火”。
2017年初,搜狗的問答機器人汪仔登上了《一站到底》的舞臺。不過這些在綜藝上的宣傳噱頭都是表象,搜狗真正要做的,是想將搜索升級到對話系統(tǒng)、問答系統(tǒng)和翻譯系統(tǒng)。王小川相信,加大投入后,搜狗會推出顛覆性的產(chǎn)品。
2017年11月,搜狗登陸美股,上市當(dāng)日市值突破50億美元。王小川意氣風(fēng)發(fā),他在內(nèi)部信里說,接下來“唯一的懸念是搜狗能否在搜索領(lǐng)域?qū)崿F(xiàn)顛覆,能否在人工智能領(lǐng)域引領(lǐng)重大的創(chuàng)新”。
但接下來的四年,搜狗并沒能講出一個激動人心的AI故事。歸根結(jié)底,無論是搜索還是AI,都需要極大的投入,但當(dāng)時的搜狗,“三級火箭”的流量紅利已經(jīng)吃得差不多了,從2018年之后公司營收增長開始放緩,增長率從2017年的38%下降至2019年的4%,在2020年營收更是首次出現(xiàn)同比下滑。
與此同時,門戶網(wǎng)站的光輝時期已過,處于艱難求生境地的搜狐,自然也無法給予搜狗資金支持。
搜狐創(chuàng)始人張朝陽動起了賣掉搜狗的心思。2013年投資了搜狗的騰訊,也在2020年提出全資收購搜狗。思考了380多天后,王小川忍痛放手,在2021年10月15日宣布卸任搜狗CEO。
這對搜狗獲取騰訊流量是件好事。但對于王小川當(dāng)初的技術(shù)理想來說,卻未嘗不是一種失敗。他離開搜狐,也拒絕加入騰訊,獨歸江湖。
轉(zhuǎn)折點在2023年來臨。王小川在媒體報道中表示,他在2023年1月用了ChatGPT之后,突然感覺到“變天了”。這種大語言模型能夠用最自然的方法,根據(jù)提問作出回答,“不得了,通用人工智能時代已經(jīng)到來了?!?/p>
當(dāng)年的搜狗為了問答,也做了百億參數(shù)模型,但即便使上了十八般武藝,也沒能實現(xiàn)今天大模型的效果。一旦有了大模型的加持,在搜索增強方面,將大有所為。
王小川回憶,當(dāng)時就有身邊的朋友對他說,“你特別適合做大模型”。因為,這正好需要用到搜索、輸入法等相關(guān)的AI能力。
這話對王小川來說,也不知是激勵還是辛酸。王小川說,當(dāng)時他回想了一下,自己過去干了20多年搜索,卻從來沒人和他說過:“小川,你適合做搜索?!?/p>
于是,王小川重出江湖,要實現(xiàn)他的AI“初心”,彌補搜狗的遺憾。
百川智能旗下,重新聚集的就是原來“搜狗系”人馬。除了茹立云之外,前搜狗CMO洪濤、前搜狗搜索總經(jīng)理陳煒鵬也已回歸。當(dāng)初在搜狗時,王小川和茹立云、洪濤、前搜狗CTO楊洪濤曾并稱為“四大天王”,現(xiàn)在,其中的三位已經(jīng)再度聚首。
截至去年10月,百川智能員工已超170人,公司技術(shù)聯(lián)合創(chuàng)始人陳煒鵬曾表示,搜狗之前各個業(yè)務(wù)線最優(yōu)秀的干將如今已基本集結(jié)完畢。王小川也說,搜狗老班底互相之間有信任,會更優(yōu)先歸隊。
在大模型如何發(fā)揮價值上,王小川也再度強調(diào)了“搜索”,他提出“搜索增強”的解決方案。搜索增強可以將大模型的能力與搜索引擎相結(jié)合,給大模型“投喂”更精準(zhǔn)、更深入的搜索結(jié)果,有助于減少錯誤答案,即所謂的“幻覺”現(xiàn)象。
“從國內(nèi)來看,搜索增強是大模型走向?qū)嵱玫牡谝徊?,甚至是最關(guān)鍵的一步,沒有搜索增強的大模型在企業(yè)里是沒法落地的?!蓖跣〈ㄔ谛履暝妇袄铮苍俅螐娬{(diào)了這一點。
“我最動心的是,能和一群有理想的人,用極致的技術(shù)驅(qū)動創(chuàng)造出顛覆性的智能產(chǎn)品?!痹诎俅ㄖ悄艹闪r的公開信中,王小川如是寫道。
02、創(chuàng)業(yè)急轉(zhuǎn)彎
眾所周知,王小川和百度董事長、CEO李彥宏一直“不來電”。創(chuàng)業(yè)之后,王小川再度調(diào)侃了李彥宏和百度的文心一言,隨后百度回嘴說,“王小川脫離一線太久,確實跟我們不在一個宇宙,自然對國內(nèi)人工智能技術(shù)的發(fā)展缺乏了解?!?/p>
這句話戳中了王小川的“痛點”。第二天凌晨他就發(fā)布一條微博懟了回去:“什么樣的平行宇宙里,才能做到讓一個脫離一線15年的人,去懟一個脫離一線1.5年的人?!币粫r間,空氣里充滿了火藥味。
但這確實也是很多人所關(guān)注的一點:畢竟,王小川已經(jīng)離開科技行業(yè)一年多了,這段時間里,他做什么去了?
王小川其實一直在創(chuàng)業(yè),只不過他的經(jīng)歷,在不少人眼里,和人工智能以及大模型,離得有點兒遠(yuǎn)。
在離開搜狗時,王小川說,之后將關(guān)注生命科學(xué)和醫(yī)學(xué),“為大眾健康做貢獻(xiàn)”。
彼時,醫(yī)療健康產(chǎn)業(yè)正站上風(fēng)口。在2020年時,我國大健康產(chǎn)業(yè)規(guī)模已經(jīng)突破10萬億元,根據(jù)“健康中國”戰(zhàn)略,到2030年產(chǎn)業(yè)總規(guī)模將達(dá)到16萬億。然后,他在2021年出手投資了腸道醫(yī)療技術(shù)開發(fā)商“熱心腸研究院”;以及專注于口腔人工智能醫(yī)療的公司DeepCare羽醫(yī)甘藍(lán),該公司通過深度學(xué)習(xí),推出了口腔影像AI分析系統(tǒng)。
從2021年到2022年,王小川連續(xù)注冊了三家名字帶“五季”的公司,包括北京五季科技有限公司、北京五季健康咨詢有限公司和五季醫(yī)學(xué)科技有限公司。后來有市場傳聞稱,當(dāng)時王小川是準(zhǔn)備做智能硬件,打造一款治療打鼾的智能枕頭;但在2023年初,王小川用了2周時間,就做出了決定,放下這個創(chuàng)業(yè)項目,去做大模型。
根據(jù)天眼查信息,茹立云也曾在五季醫(yī)學(xué)科技有限公司持股。去年9月,茹立云退出股東行列,全身心跟隨王小川創(chuàng)業(yè)。而“留守”在這家公司的另一位自然人股東,就是搜狗“四大天王”的最后一位楊洪濤。
從醫(yī)療健康到大模型,王小川在創(chuàng)業(yè)路上,猛然打了個急轉(zhuǎn)彎。
作為從互聯(lián)網(wǎng)創(chuàng)業(yè)時代走過的“老兵”,王小川靈敏地嗅到了“技術(shù)變革”的氣息。過去,從搜索到人工智能,搜狗一直處于百度的下風(fēng),王小川也沒有擺脫李彥宏的“陰影”?,F(xiàn)在,他終于看到了一次率領(lǐng)團(tuán)隊、再度挑戰(zhàn)舊秩序的機會,這是他必須抓住的契機。
但之前創(chuàng)業(yè)的公司也尚未見眉目,再度轉(zhuǎn)向人工智能,在外界看來,王小川似乎是一直在追逐風(fēng)口。
王小川自己并不這么認(rèn)為。他在后來接受媒體采訪時表示,自己當(dāng)年讀研期間做的課題,就是跟基因測序拼接算法相關(guān)的。因此,他也好奇“如何用數(shù)學(xué)模型去刻畫生命”,而人工智能的發(fā)展,同樣也是激發(fā)了他的想法,想用深度學(xué)習(xí)的方法去理解生命科學(xué)。
盡管有了這一番解釋,但AI技術(shù)實際上還遠(yuǎn)沒有走到如此地步。即使是大語言模型,解決的還是人和機器如何對話的問題。
除此之外,業(yè)界最想了解的問題就是:大模型創(chuàng)業(yè)“前無古人”,在搜狗之后,王小川這次要怎么講、以及能不能講好一個全新的AI故事?
03、百川智能,一路急奔
在創(chuàng)業(yè)之初,王小川和其他創(chuàng)業(yè)者一樣,都集中在研發(fā)通用大模型上。其中的邏輯也很簡單:既然OpenAI是這么起家的,那么國內(nèi)也一定要有自己的底座大模型。但大模型賽道已逐漸變得擁擠:到去年10月時,國內(nèi)已涌現(xiàn)了238個大模型;自2023年8月第一批國產(chǎn)大模型通過備案起,截至今年2月,已經(jīng)有40余款大模型獲批對外開放。
“百模大戰(zhàn)”中,百川智能做得究竟怎么樣?為了打一場和搜狗不同的“翻身仗”,占領(lǐng)先機,王小川帶領(lǐng)百川一路跑得非?!凹薄薄?/p>
依靠搜狗時積累的工程能力、王小川的清華技術(shù)背景和大佬人脈,百川智能已經(jīng)成為國內(nèi)在2023年誕生的為數(shù)不多大模型“獨角獸公司”之一。根據(jù)去年10月百川智能公開的信息,其年內(nèi)累計融資已達(dá)3.5億美元?!锻睃cLatePost》估計,當(dāng)前其估值約達(dá)18億美元。此外的三家估值超10億美元的公司分別是通用大模型公司MiniMax、智譜AI和李開復(fù)的零一萬物,它們共同成為大模型創(chuàng)企中殺出的“黑馬”。
成立后半年內(nèi),百川智能接連發(fā)布了baichuan-7B/13B、Baichuan2-7B/13B四款開源可免費商用大模型及兩款閉源大模型;平均每28天就會發(fā)布一款新的大模型。
最引人注目的是,百川智能對“引領(lǐng)開源”的強調(diào)。“Baichuan2-7B以70億參數(shù),在英文評測級上能與130億參數(shù)的LLaMA2(META AI正式發(fā)布的新一代開源大模型)持平?!蓖跣〈ㄔ谌ツ?月發(fā)布該產(chǎn)品時表示,“我們現(xiàn)在可以獲得比LLaMA更友好且能力更強的開源模型,能夠幫助扶持中國整個生態(tài)的發(fā)展?!?/p>
這也直接把國內(nèi)大模型競爭“卷”向了一個新的高度。越來越多的通用大模型開源,參數(shù)也越來越大。去年年中,阿里云也加入戰(zhàn)團(tuán),成為首家開源的國內(nèi)大廠。去年12月,阿里云又宣布開源通義千問720億參數(shù)模型Qwen-72B。
但大模型能否如手機的安卓系統(tǒng)一樣,上演一出開源“逆襲”的故事,還是個未知數(shù)。
2023年11月、12月相對沉寂的百川智能,在今年1月底又突然發(fā)布了超千億參數(shù)大模型Baichuan 3。超千億參數(shù)模型在訓(xùn)練過程中對高質(zhì)量數(shù)據(jù),訓(xùn)練穩(wěn)定性、訓(xùn)練效率的要求都高出幾個量級,而從Baichuan大模型1.0的發(fā)布到如今3.0,百川只用了9個月時間。王小川給自己的“KPI”壓力之大,可見一斑。
王小川在創(chuàng)業(yè)時的交流會上,就給公司構(gòu)建起了初步的目標(biāo):年底前預(yù)計會發(fā)布對標(biāo)GPT-3.5的大模型,并有信心“做到國內(nèi)最好”,還要做到搜索增強、多模態(tài)的增強。
Baichuan 3顯然目標(biāo)是全面對標(biāo)GPT-3.5、追趕GPT-4的。百川智能沒有透露模型參數(shù)量,相比之下,GPT-3.5是1750億參數(shù)。百川方面表示,在多個權(quán)威通用能力評測如CMMLU、GAOKAO和AGI-Eval中,Baichuan 3都展現(xiàn)了出色的能力;而在CMMLU、GAOKAO、HumanEval和MBPP等多個中文評測榜單上,更是超越了GPT-4。
在創(chuàng)業(yè)時,王小川曾稱,百川智能將同時發(fā)展通用和垂類模型,尤其是在醫(yī)療等知識層面重點增強??梢钥吹?,王小川在商業(yè)模式上,當(dāng)時也有了自己的思考,先在具體場景里做優(yōu)化、積累行業(yè)用戶,構(gòu)建生態(tài),先把模式跑通。在行業(yè)選擇上,王小川則是萬變不離其宗,除了搜索老本行,他投資多年的醫(yī)療領(lǐng)域有了用武之地,進(jìn)入了首選名單。
對于Baichuan 3,百川方面也強調(diào)了其在醫(yī)療領(lǐng)域內(nèi)的能力。Baichuan3的醫(yī)療數(shù)據(jù)集Token數(shù)超千億,醫(yī)療能力逼近GPT-4。在對邏輯推理能力及專業(yè)性要求極高的MCMLE、MedExam、CMExam等權(quán)威醫(yī)療評測上的中文效果,Baichuan 3同樣超過了GPT-4,是中文醫(yī)療任務(wù)表現(xiàn)最佳的大模型。
趕在新年前面世的超千億大模型,可以說是王小川和百川智能給自己年初的目標(biāo),做的一個“年終總結(jié)”。
但這份成績顯然還有待繼續(xù)提高。畢竟,目前也沒有一款大模型可以成為公認(rèn)的“國內(nèi)最好”。就在不久前的1月16日,智譜AI也發(fā)布全國產(chǎn)的新一代基座大模型GLM-4,整體性能已逼近GPT-4。最引人注目的是,智譜AI還發(fā)布了定制化的個人GLM大模GLMs和GLMStore,全面對標(biāo)OpenAI的GPT商店。
同時,對于大模型,資本的熱情已在漸漸消退。“下一階段,估計很少有人再會投這種基座大模型了,而是會把注意力放到各行業(yè)的應(yīng)用上去。”一位投資人告訴「市界」。大模型融資創(chuàng)業(yè)的窗口也接近關(guān)閉,一位大模型創(chuàng)業(yè)者吐槽說,自己一段時間密集見了30多家投資機構(gòu),卻沒有人出手投資。
資本熱度已經(jīng)逐漸減退,而大眾感興趣的“顛覆時刻”,似乎還沒有真正意義上到來。通用大模型紛紛開放后,下一步又將“卷”些什么?同時,市場也迫切希望,能夠早日看到大模型們清晰的商業(yè)化路徑。
市場曾有聲音判斷,2024年將是AI應(yīng)用迎來爆發(fā)?!癆I原生時代,我們需要100萬量級的AI原生應(yīng)用,但是不需要100個大模型?!崩顝┖暌苍诮诒硎?。
王小川不止一次在公開場合提到過“超級應(yīng)用”。他認(rèn)為,中國的機會或許不是技術(shù)科研上比美國跑得快,而是在應(yīng)用上跑得更快。即“理想上慢半步,落地上快一步”。去年6月,他去美國硅谷走了一圈,發(fā)現(xiàn)OpenAI正在嘗試把1000萬顆GPU連在一起,訓(xùn)練一個大規(guī)模的模型?;貋碇?,這句話就被他調(diào)整成了“理想上慢一步,落地上快三步”,在產(chǎn)品應(yīng)用上要跑得更快了。
但百川智能的超級應(yīng)用仍然“在路上”。2023年的年底時,王小川在公開活動中還表示,針對C端的超級應(yīng)用,預(yù)計會在2024年推出,“主要針對健康、快樂、個人助理方向”。
很多企業(yè)也發(fā)現(xiàn),即使AI應(yīng)用出現(xiàn),大模型時代的應(yīng)用模式,也和移動互聯(lián)網(wǎng)時代不同。這仍是一條需要探索的路徑。像去年火爆一時的妙鴨相機,就跳過了“免費獲取早期用戶市場”階段,在推出的第一天就開始收費,但很快其熱度也下降了。
對于大模型公司來說,現(xiàn)在探討如何穩(wěn)定造血還為時過早,目前還是處于卡位戰(zhàn)的階段。而在“百模大戰(zhàn)”的下半場,淘汰賽也即將開始。
2015年那波AI浪潮中,就誕生過業(yè)界公認(rèn)的AI“四小龍”。后來,四小龍中的商湯科技、云從科技都已經(jīng)成功登陸資本市場。但是,以它們?yōu)榇淼哪且淮鶤I創(chuàng)企,也普遍都經(jīng)歷過估值過高之后,商業(yè)化變現(xiàn)艱難等問題,很多公司直到現(xiàn)在還在苦惱盈利難題。
經(jīng)歷過這些的投資人們,面對大模型時出手更為謹(jǐn)慎,更加重視公司實現(xiàn)自我造血的能力。而無論是國內(nèi)還是海外,大模型技術(shù)和產(chǎn)品都還處于探索期,從數(shù)據(jù)安全、應(yīng)用場景到商業(yè)模式,都充滿著不確定性,所有人都在摸著石頭過河。
王小川這次創(chuàng)業(yè),“押上”了自己的名字。他要實現(xiàn)昔日夢想,也要謹(jǐn)慎地避免重蹈覆轍。不過幸好,生成式AI大幕才拉開不久,未來舞臺還足夠廣闊。
作者 | 楊 潔
編輯 | 孫春芳
聯(lián)系客服