大模型賽道的參與者一度處于比以往更深的焦慮中。這一領(lǐng)域內(nèi),基礎(chǔ)技術(shù)研究動(dòng)輒融資上億,而可行的商業(yè)模式,卻還在空中摸索。
但三月的“長文本”概念破圈,重新攪動(dòng)了一池心意。
自3月18日,剛滿一歲的中國初創(chuàng)AGI公司月之暗面宣布旗下大模型Kimi智能助手開啟200萬字無損上下文內(nèi)測(cè)后,國內(nèi)各家大廠先后下場(chǎng),秀肌肉一般宣布起各自在長文本領(lǐng)域的升級(jí)。
上傳英偉達(dá)過去幾年的完整財(cái)報(bào),讓Kimi成為英偉達(dá)財(cái)務(wù)研究專家,幫用戶分析總結(jié)英偉達(dá)歷史上的重要發(fā)展節(jié)點(diǎn)
3月中旬,阿里旗下大模型工具通義千問宣布,向用戶開放免費(fèi)長文檔解析處理功能,支持約1000萬字的超長文檔處理;
百度向《科創(chuàng)板日?qǐng)?bào)》透露,4月將在版本升級(jí)后開放長文本能力,文本處理范圍在200萬-500萬,是當(dāng)下最高2.8萬字文檔處理能力的上百倍;
360智腦宣布內(nèi)測(cè)500萬字長文本處理功能,并表示早在2月底,360AI瀏覽器已向用戶開放100萬字長文本閱讀和拓展功能。
被濃烈的FOMO(Fear of Missing Out)情緒裹挾,這場(chǎng)大模型文本處理能力比拼,掀起二級(jí)市場(chǎng)一股猛烈的跟投風(fēng)。三月下旬,與Kimi有關(guān)聯(lián)的上市公司被打包進(jìn)“Kimi概念股”板塊,強(qiáng)勢(shì)拉漲AI應(yīng)用板塊。與Kimi存在關(guān)聯(lián)的華策影視、掌閱科技、中廣天擇等多股,在18日后股價(jià)相繼迎來漲停。
高燒兩周后,如今“Kimi概念”逐漸降溫,但其背后這個(gè)閃爍著“小天才”光環(huán),由90后創(chuàng)始人建立的、估值達(dá)25億美元的國內(nèi)初創(chuàng)公司,無疑讓更多人看見低門檻投身大模型領(lǐng)域淘金的抓手。
對(duì)資本市場(chǎng)而言,2023年的初始基建時(shí)期已經(jīng)過去,這一領(lǐng)域的商業(yè)落地故事,才剛剛起勢(shì)。
長文本,關(guān)用戶什么事?
在技術(shù)圈內(nèi),風(fēng)頭正勁的長文本并不是一個(gè)稀奇物。
簡單來說,大模型支持的上下文窗口容量,可類比計(jì)算機(jī)的運(yùn)行內(nèi)存,也可理解為大模型的理解力與記憶力。在與大模型進(jìn)行內(nèi)容交互(如問答對(duì)話)的過程中,大模型有一個(gè)可容納的文本容量上限。這一上限不僅關(guān)系到大模型單次處理文本的能力,也關(guān)系到大模型記憶連續(xù)對(duì)話的容量。
當(dāng)大模型的長文本容量增加,該大模型在對(duì)話時(shí)可以考慮的上下文信息就越多,越有助于產(chǎn)生有針對(duì)性的連貫對(duì)話,也能確保在這一容量內(nèi)的文本信息丟失情況減小。用戶可以喂給大模型更多信息,而大模型根據(jù)這一用戶與機(jī)器的歷史互動(dòng),回以個(gè)性化解釋。
月之暗面CEO楊植麟曾詩意地表示,長文本(long context),是做成通用世界模型的第一步,“登月第一步”。
這一步,在技術(shù)圈內(nèi)被認(rèn)可為重要但并非獨(dú)特的一步。
正如曾經(jīng)計(jì)算機(jī)內(nèi)存在過去幾十年內(nèi)漲了好幾個(gè)數(shù)量級(jí)一樣,越來越大的長文本容量同樣出現(xiàn)在大模型領(lǐng)域。各家均會(huì)發(fā)力做內(nèi)存升級(jí),但受限于長文本對(duì)算力消耗大、成本高,真正入局卷基礎(chǔ)技術(shù)的公司有限,長文本也不是各家大模型的宣傳重心。
月之暗面則另辟蹊徑,看見了長文本技術(shù)在用戶端可以產(chǎn)生的影響,并實(shí)行了Kimi與長文本強(qiáng)綁定的宣傳策略。
圖源:月之暗面(Moonshot AI)
早在2023年10月,推出Kimi應(yīng)用的第一天,月之暗面便在官方公眾號(hào)上宣傳,“歡迎與Moonshot AI共同開啟Loooooooooong LLM時(shí)代”。
它高調(diào)宣稱,Kimi Chat是首個(gè)支持輸入20萬漢字的智能助手產(chǎn)品,其文本容量2.5倍于Cloude的100K,8倍于GPT-4的32k。
容量升級(jí),導(dǎo)向的是更好的用戶體驗(yàn)。月之暗面表示,當(dāng)前大模型使用過程中的遺漏重要信息、不支持長文本prompt輸入導(dǎo)致的場(chǎng)景設(shè)定不清晰、無法基于大量給定材料給出專業(yè)回應(yīng)等問題,均會(huì)在大模型擁有足夠長的上下文輸入容量后迎刃而解。
這相當(dāng)于一個(gè)記憶容量更大、理解能力更好的大腦。
“它很本質(zhì)?!睏钪谗肴缡钦f。
如此強(qiáng)調(diào),是為了搶奪產(chǎn)品在用戶心中的定位。成立之初,月之暗面便定下了獨(dú)特的商業(yè)模式,不做目前看來商業(yè)模式更清晰的B端,而是在做基礎(chǔ)大模型研究的同時(shí),面向C端發(fā)力,意圖通過技術(shù)提升,攻克C端用戶個(gè)性化服務(wù)的需求。
楊植麟曾表示,在大模型領(lǐng)域,基礎(chǔ)技術(shù)突破和提供個(gè)性化服務(wù)走的是同一條路。通過不斷升級(jí)這一“大腦”的“腦容量”,每個(gè)C端用戶都會(huì)獲得一個(gè)更能記憶與自己的互動(dòng)歷史的模型,從而得到更獨(dú)特的、無法被復(fù)刻的反饋。
這是一招燒錢獲客的險(xiǎn)棋。由于當(dāng)前各家大模型C端應(yīng)用同質(zhì)化程度高,普遍為對(duì)話助手形式,在資金充裕的阿里、百度等大廠仍提供免費(fèi)應(yīng)用的情況下,各家公司不敢貿(mào)然進(jìn)行收費(fèi)。當(dāng)公司將商業(yè)模式定在用戶端,暫時(shí)看來,其只能仰賴投資人的源源不斷的資金流入,以保證研發(fā)及運(yùn)營的現(xiàn)金流。
根據(jù)《新浪科技》報(bào)道,月之暗面當(dāng)前投放廣告獲客成本約為10元,加上拉新后用戶問答產(chǎn)生的算力成本,每個(gè)用戶的獲客成本約為12-13元。
按照第三方數(shù)據(jù)平臺(tái)七麥數(shù)據(jù)的用戶下載量預(yù)估,近一個(gè)月IOS端Kimi累計(jì)下載量超82萬,僅iPhone端日均獲客成本已超32萬,近一個(gè)月iPhone端獲客成本近一千萬。若加上安卓端、網(wǎng)頁端的運(yùn)營成本,獲客成本更要上一級(jí)臺(tái)階。
2024年3月,Kimi智能助手下載量估算/圖源:七麥數(shù)據(jù)
盡管費(fèi)用不低,但這一數(shù)據(jù)某種程度上驗(yàn)證了月之暗面發(fā)展策略的有效性。
在文心一言、通義千問這類大廠產(chǎn)品已形成一定的用戶口碑的當(dāng)下,Kimi憑借其對(duì)長文本技術(shù)和使用場(chǎng)景的強(qiáng)調(diào),在用戶心中營造出“精確+個(gè)性化”的觀感,為許多用戶找到了試用Kimi的理由。
此外,在發(fā)布Kimi的半年內(nèi),月之暗面進(jìn)一步宣布升級(jí)Kimi長文本容量為200萬漢字,比今年2月谷歌Gemini1.5支持的100萬token還高。這一技術(shù)升級(jí)在用戶端完成了口碑積累與破圈。
根據(jù)AI產(chǎn)品榜(aicpb.com),2023年2月,Kimi在2月訪問量驟增一倍,增速在國內(nèi)訪問量前十的AI產(chǎn)品中位居第一。
圖源:AI產(chǎn)品榜(aicpb.com)
也正因這一脫胎于初創(chuàng)公司的軟件在用戶端獲得如此大的反響,各家大廠才按耐不住,參與進(jìn)自家大模型長文本能力的展示中。
在許多投資人看來,技術(shù)已不是當(dāng)前大模型下一步發(fā)展的難點(diǎn),更困難的在于找到適應(yīng)市場(chǎng)的產(chǎn)品模式。
多名AI行業(yè)分析師向鹽財(cái)經(jīng)表示,大模型技術(shù)領(lǐng)域的突破依賴人才、資金和數(shù)據(jù),技術(shù)升級(jí)背后的邏輯往往能歸因于規(guī)模定律。在資本投資意愿仍然旺盛、商業(yè)模式尚不清晰的當(dāng)下,初創(chuàng)企業(yè)和大廠各有優(yōu)勢(shì)。
正如峰瑞資本投資合伙人陳石在Sora發(fā)布后所言,“這輪AI行情有一個(gè)突出的特點(diǎn),就是'天底下沒有秘密’?!睂?duì)擺出更大數(shù)據(jù)來“圍剿”Kimi的大廠而言,這不僅是秀實(shí)力,更是爭(zhēng)奪用戶市場(chǎng)的先聲。
搶灘入局,機(jī)會(huì)與恐懼
盡管Kimi激起了一陣水花,但在兩周內(nèi)迅速降溫的概念股指數(shù),展現(xiàn)了當(dāng)下大模型領(lǐng)域?qū)擂蔚纳虡I(yè)現(xiàn)狀:不想錯(cuò)過,害怕做錯(cuò)。
早在“Kimi概念”興起之前,大模型領(lǐng)域已經(jīng)歷了數(shù)輪類似的技術(shù)比拼。如在更為吸睛的多模態(tài)大模型領(lǐng)域,國內(nèi)大廠在2023年年底,已在文生視頻、圖生視頻領(lǐng)域暗暗角力。
2023年11月18日,字節(jié)跳動(dòng)推出了視頻生成模型PixelDance,緊隨其后,阿里上線Animate Anyone模型,并先后宣布開源圖生視頻模型I2VGen-XL和文生視頻模型ModelScopeT2V。
今年1月,大廠在文生視頻、圖生視頻領(lǐng)域角逐更甚,字節(jié)跳動(dòng)、騰訊、百度相繼推出視頻生成模型MagicVideo-V2、VideoCrafter2和UnivG,均支持文圖生成視頻。
站在未來的風(fēng)口面前,各家均不想錯(cuò)過搶占先機(jī)的可能。但這也導(dǎo)致了在技術(shù)門檻不高、規(guī)模定律起主導(dǎo)作用的當(dāng)下,企業(yè)堆疊大量資金與精力于其中,做出來的模型卻面臨“重復(fù)造輪子”的窘?jīng)r。
更殘酷的是,當(dāng)Sora這類支持生成60秒視頻,達(dá)成技術(shù)突破的大模型出現(xiàn)后,此前辛苦做出的“輪子”,也面臨被迭代風(fēng)險(xiǎn)。
對(duì)月之暗面這類技術(shù)信仰派的公司而言,大模型領(lǐng)域的種種廝殺故事,確實(shí)是在一次次驗(yàn)證其創(chuàng)始人楊植麟的“第一性原理”,即未來屬于一個(gè)超級(jí)應(yīng)用AGI(人工通用智能),而當(dāng)前唯一要做的事是做到最強(qiáng)的技術(shù)能力,走向這一超級(jí)應(yīng)用。
當(dāng)前,外部整體投資意愿收縮,這也導(dǎo)致大模型領(lǐng)域的投資人雖身處熱門賽道,也不得不在開始時(shí)便為自己多想退路。
根據(jù)投中研究院數(shù)據(jù),2024年2月,中國VC/PE市場(chǎng)投資總規(guī)模同比下降33.17%,環(huán)比下降40.31%。
盡管AI領(lǐng)域展開的投資畫卷仍有吸引力,讓人工智能成為當(dāng)期細(xì)分領(lǐng)域下獲投規(guī)模最高的細(xì)分賽道,但冷靜的資本市場(chǎng),也讓投資人更愿意分散下注,期待在大模型應(yīng)用領(lǐng)域跑出黑馬。
資本對(duì)重復(fù)造輪的厭倦與猶豫,正如市場(chǎng)派的投資者,金沙江創(chuàng)投主管合伙人朱嘯虎所言:“整出200多個(gè)大模型有啥意義呢?沒啥意義。但在應(yīng)用層有很多創(chuàng)新。中國在數(shù)據(jù)和應(yīng)用場(chǎng)景上是遠(yuǎn)遠(yuǎn)超過美國的?!?/p>
對(duì)技術(shù)派而言,大模型的終極意義或許在實(shí)現(xiàn)AGI,但在更實(shí)際的市場(chǎng)派看來,更終極的問題在于,“大模型的商業(yè)模式到底怎樣才有效”?
多位產(chǎn)業(yè)分析師向鹽財(cái)經(jīng)表示,當(dāng)前,大模型商業(yè)化尚處于萌發(fā)期,2024年可被看作大模型應(yīng)用元年,資本與技術(shù)都已積累到一定程度,在迫切地尋找可行的商業(yè)模式。比起模糊不定的C端市場(chǎng),當(dāng)前發(fā)展垂域大模型,與行業(yè)相結(jié)合,是一個(gè)較為可行的方向。
創(chuàng)道硬科技創(chuàng)始人步日欣表示,當(dāng)前的基礎(chǔ)大模型由于數(shù)據(jù)來源龐雜,是一個(gè)難以實(shí)現(xiàn)專業(yè)化應(yīng)用的泛化大模型。因此,將大模型與垂直領(lǐng)域數(shù)據(jù)結(jié)合,培育出專業(yè)小模型,是一條能走出差異化的路徑。這類模型在預(yù)處理后可以面向B端客戶,而其內(nèi)部數(shù)據(jù)的稀缺性,便是產(chǎn)品的護(hù)城河。
“這類似于上一個(gè)互聯(lián)網(wǎng)時(shí)代,利用大模型技術(shù),在各個(gè)細(xì)分領(lǐng)域與行業(yè)耦合?!?/p>
這同樣需要盡早入局。步日欣指出,誰在行業(yè)內(nèi)有足夠的數(shù)據(jù)積累,誰便更能在這場(chǎng)應(yīng)用變革中占據(jù)優(yōu)勢(shì)。
至于基礎(chǔ)大模型的贏家將在出現(xiàn)在哪邊,人們觀感并不一致。步日欣表示,AI領(lǐng)域需要的資金投入遠(yuǎn)大于此前SaaS發(fā)展時(shí)期,資本雄厚的傳統(tǒng)互聯(lián)網(wǎng)大廠,更有發(fā)展大模型的優(yōu)勢(shì)。
艾媒咨詢創(chuàng)始人張毅則認(rèn)為,在互聯(lián)網(wǎng)大廠抬高入局門檻的情況下,新銳企業(yè)有更強(qiáng)的融資能力、引才能力。這就像互聯(lián)網(wǎng)發(fā)展的早期階段,大廠尚未成型,新銳企業(yè)更愿意試錯(cuò),而新的道路往往誕生于這無畏的嘗試中。
這場(chǎng)圍繞Kimi而起的長文本大戰(zhàn),背后涌動(dòng)的是兩種發(fā)展觀念的交鋒。站在技術(shù)果實(shí)成熟的前夜,原本漸趨固化的競(jìng)爭(zhēng)格局,重新展現(xiàn)出許多可能。
來源:鹽財(cái)經(jīng)
聯(lián)系客服