導(dǎo)語:受Kimi影響,百度的文心一言和阿里的通義千問,用戶訪問量大幅下滑,降幅分別達(dá)到33.42%與45.05%。
01 此消彼長
問世以來,Kimi就在不斷“吊打”國內(nèi)各大廠AI模型。
根據(jù)券商監(jiān)測數(shù)據(jù),截止3月25日,Kimi的網(wǎng)頁端、APP端的用戶DAU(Daily Active User,日活躍用戶數(shù)量)突破歷史新高,分別達(dá)到了79萬和54萬。疊加小程序用戶量,全端總DAU顯著大于225萬,或已超越百度(BIDU.O/9888.HK)旗下大模型文心一言的233萬。
而半個月之前,3月10日,Kimi的全端DAU剛剛突破120萬人。但其實早在2月,Kimi的用戶訪問量就已達(dá)到305萬,相較1月超翻倍增長。
與此同時,百度的文心一言和阿里(BABA.N/9988.HK)旗下的通義千問兩大TOP2玩家,用戶訪問量則大幅下滑,降幅分別達(dá)到33.42%與45.05%。
數(shù)據(jù)屢破新高下,Kimi的一舉一動也被大廠關(guān)注并模仿。
Kimi是月之暗面推出的對話式AI產(chǎn)品。3月18日,月之暗面宣布Kimi支持200萬字的無損上下文輸入。而在半年之前,去年10月發(fā)布時,Kimi可支持的無損上下文輸入長度僅為20萬字。
因此,大模型的“長文本能力”也受到大廠關(guān)注,甚至被認(rèn)為是大模型競爭的重要性能指標(biāo)。
3月22日,通義千問升級,向所有人免費開放 1000 萬字的長文檔處理功能;360的智腦正式內(nèi)測500萬字長文本處理功能,該功能即將入駐 360AI 瀏覽器。
文心一言也宣布將于4月升級,屆時也將開放長文本能力,文字范圍預(yù)計將在200萬-500萬。
據(jù)筆者了解,不少業(yè)內(nèi)人士卻并不看好這些大廠的“東施效顰”。他們認(rèn)為,Kimi在長文本領(lǐng)域的領(lǐng)先身位,并沒有那么容易被超越。
或許正因于此,今年2月,在月之暗面最新一輪融資中,阿里作為領(lǐng)頭方,其投資額度的百分之七八十,被置換成算力服務(wù)。
02 kimi的靈魂
互聯(lián)網(wǎng)大廠,集中了各領(lǐng)域的技術(shù)頂尖人才,但鮮有像Kimi這樣的“明星員工”。
月之暗面創(chuàng)始人楊植麟,是Kimi團(tuán)隊的靈魂人物。他擁有清華和卡內(nèi)基梅隆背景,本人是長文本領(lǐng)域?qū)<摇?/span>
在過去五年內(nèi)的自研語言處理(NLP)領(lǐng)域,楊植麟有相當(dāng)?shù)挠绊懥?。在華人學(xué)者引用排名中,楊植麟的學(xué)術(shù)論文位居前10,在40歲以下排名第一。
在讀博士期間,楊植麟就以第一作者身份發(fā)表Transformer-XL和XLNet兩項工作,在谷歌學(xué)術(shù)上被引用近兩萬次,并在多個NLP任務(wù)上取得了當(dāng)時的最佳效果。
Transformer-XL成為首個全面超越RNN的注意力語言模型,XLNet則在20項頂級會議中獲得最佳論文提名。
楊植麟以及他的團(tuán)隊,創(chuàng)造了Kimi表現(xiàn)優(yōu)秀的無損壓縮技術(shù)。這種技術(shù)可減少參數(shù)對存儲的需求、推理的算力,以及數(shù)據(jù)傳輸?shù)膸捳加?,從而高效率無損處理百萬級的長Token。
而為了快速趕上長文本熱潮,其他大廠只能退而求其次,選擇檢索增強(qiáng)生成RAG技術(shù)。
Kimi的無損長上下文窗口的方案,是在逐字閱讀全文后給出答案。RAG技術(shù)是對全文關(guān)鍵信息進(jìn)行檢索生成答案,但可能會丟失掉部分關(guān)鍵的信息。
因此,與前者相比,無論對比輸出的深度還是精度,大廠的模型都還存在較大差距。
目前,Kimi并沒有公布無損壓縮技術(shù)細(xì)節(jié)。除了論文,該技術(shù)在學(xué)界也沒有太多開源內(nèi)容可參照。大廠想要“學(xué)習(xí)”、并工程化是非常困難的。
技術(shù)之外,Kimi的戰(zhàn)略也值得思考。
為快速“跟上形勢”,大廠一上手就追求花哨的多模態(tài)、導(dǎo)致“樣樣通樣樣松”走入平庸。
而Kimi選擇“一擊必殺”——首先垂直選擇打透長文本領(lǐng)域,以培養(yǎng)用戶心智,積累用戶留存。
自發(fā)布以來,Kimi除了將上下窗口從最初的20萬字拓展到200萬字之外,在指令理解、信息檢索能力和模型相應(yīng)速度上,也持續(xù)迭代。
月之暗面內(nèi)部人士介紹,基于Infra層的優(yōu)化,Kimi生成速度較去年10月份提升了三倍。
2023年12月、今年1月和2月,Kimi用戶留存分別為18.48%、22.25%和23.36%。這種高留存的粘性,同時形成了正反饋。
用戶們在使用過程中自發(fā)“喂”給Kimi很多專業(yè)語料。通過不斷學(xué)習(xí)和處理各種類型的語料,Kimi更能理解和適應(yīng)不同的語境、問題和需求,從而提高其性能和準(zhǔn)確性。
在此類專業(yè)語料處理上的進(jìn)步速度,Kimi甚至快于Open AI。
這是因為,目前Open AI對于C端用戶上傳文件仍然有限制。而對于Kimi用戶而言,則是親手培養(yǎng)了一個高學(xué)習(xí)力的免費私人助手,持續(xù)進(jìn)行互動。
03 加碼海外市場
正如馬斯克近日發(fā)言,升級技術(shù)路線的方法,不是與競爭對手比較,那就太簡單了。應(yīng)是不斷挑戰(zhàn)物理極限。
超越百度等大廠,或許并非Kimi的目標(biāo)。下一步擴(kuò)張,月之暗面指向了海外。
目前,月之暗面正在對外招聘國內(nèi)/國外效果廣告設(shè)計師。除國內(nèi)廣告平臺設(shè)計外,這一崗位,還需承擔(dān)公司產(chǎn)品在海外各大廣告平臺,如Google,Meta,Tiktok等廣告創(chuàng)意設(shè)計。
同時,月之暗面也在補(bǔ)足運營短板。
月之暗面技術(shù)團(tuán)隊僅有100多人,是頭部國產(chǎn)大模型公司中,人數(shù)最少的一家。包括安卓工程師、測試、市場、人力等等,都是公司正在招聘的崗位。
以產(chǎn)品增長職位為例,該職位要求有大廠工作經(jīng)驗且擅長通過社交媒體和用戶裂變策略推動產(chǎn)品增長,包括擁有從0到1000萬用戶增長的經(jīng)驗,專注于提升活躍用戶數(shù)量和長期留存率等職責(zé)。
“打不過就加入”。對于Kimi的崛起,阿里雖有自己的通義千問,但也給予了支持。
目前,Kimi借調(diào)了阿里的英偉達(dá)(NVDA.O)A800以及A100 GPU處理器的機(jī)型進(jìn)行擴(kuò)容,未來Kimi算力側(cè)的支持,也將主要來自于阿里。
今年2月,在月之暗面最新一輪超10億美元投資中,阿里作為領(lǐng)投方,其投資額度的百分之七八十,將被置換成算力服務(wù)器。
有了阿里的支持,Kimi不用再擔(dān)心因為算力不足而宕機(jī)。該人士也表示,擴(kuò)容并非一步到位。一下子擴(kuò)容太多,容易造成算力閑置和浪費,需要一定的策略。比如,Kimi也會對用戶的使用情況進(jìn)行預(yù)測。
自從2022年11月ChatGPT發(fā)布以來,國內(nèi)AI大模型已超200個,且還在持續(xù)增加。Kimi的問世,喚醒了行業(yè)巨頭的危機(jī)意識。
但Kimi也并非這場技術(shù)競賽的終點。(來源:AI新智能)
聯(lián)系客服