“多模態(tài)大模型創(chuàng)造了多種可能。” 自ChatGPT發(fā)布之后,多模態(tài)大模型賽道備受各界關注,似乎也給了跨境電商領域一劑強心劑。
多模態(tài)大模型作為最前沿的AI技術,在跨境電商領域,發(fā)揮怎樣的應用前景?對于新一代創(chuàng)業(yè)者而言,他們又有怎樣的創(chuàng)業(yè)機會和挑戰(zhàn)?近日,由 GAIR 研究院、雷峰網(wǎng)、世界科技出版社、科特勒咨詢集團聯(lián)合主辦的第七屆 GAIR 全球人工智能與機器人大會,在新加坡烏節(jié)大酒店圓滿結束。而在會議多模態(tài)大模型與跨境電商的分論壇上,由Mamentum Works 創(chuàng)始人兼首席執(zhí)行官李江玕主持,Meta人工智能研究專家曹晟、人工智能專家張偉、騰訊海外游戲發(fā)行算法中心主任郎君齊聚一堂,一同分享多模態(tài)大模型下的創(chuàng)業(yè)機會。在圓桌論壇上,郎君表示,如果創(chuàng)業(yè)可能從兩個方面下手,一是從現(xiàn)有的大公司的流程里發(fā)現(xiàn)大公司可能做得不夠好的一些點,大公司又不太愿意投入一個很專注的團隊專門干的這些事情,自己創(chuàng)業(yè)就把這些事做了。二是如果我們沒有在大廠工作,可以觀察自己的生活周邊有沒有一些相對好的需求,可以用技術的方式去解決,或者用商業(yè)的方式解決,或者用產(chǎn)品的方式解決。這幾個方面,只要找到一個需求點就可以去突破。郎君覺得在AIGC領域創(chuàng)業(yè),這波還是會有很多做法。現(xiàn)在ChatGPT已經(jīng)開放了,大家用起來也很方便,也有很多的API接入技術可以使用,創(chuàng)業(yè)成本門檻已經(jīng)比以前低了很多。關鍵是要么從需求出發(fā)延伸性地做創(chuàng)新,要么就是從這個應用上繼續(xù)加一塊磚也能產(chǎn)生巨大商業(yè)價值。張偉則思考了兩條路,第一條路是在學術界中沿著這個方向做一些基礎的研究,跟政府或者是國內(nèi)的一些高校合作做一些更前端的研究,類似跟機器人的結合等。第二條路是創(chuàng)業(yè),基于ChatGPT做一些應用,比如數(shù)字人,這個方向有挑戰(zhàn),但發(fā)展得好也是一條新的商業(yè)賽道。曹晟直言,企業(yè)的周期越來越短,大家可以去接受這個事實,也不用去焦慮。首先有很多機會,同時也有很多競爭對手,第三有很多是可以被顛覆,第四要看你自己也可以顛覆的東西。曹晟覺得,大家只要結合這種模式,都是有機會的。以下為圓桌討論的內(nèi)容,雷峰網(wǎng)做了不改變原意的整理和編輯:李江玕(主持人):從去年11月ChatGPT發(fā)布出來到現(xiàn)在,整個市場發(fā)生很多變化,大模型能力也在不斷的迭代。在過去的8~9個月的時間,對很多人來說好像又變成了無限的可能,但無限的可能就得做市場,你得探索他們的東西。各位在過去的這個時間經(jīng)歷了怎么樣的心路歷程?郎君:去年11月ChatGPT橫空出世,剛開始我們的算法中心,有些同學很積極的去探索、研究,有些同學則比較保守,說這東西跟我沒關系,還有一部分人是處于觀望的狀態(tài),我是后者。當時我覺得它離我們比較遠,那是聊天的語言模型,跟我們做的視頻、音頻等技術關系不大,但是再過兩個月之后就發(fā)現(xiàn)ChatGPT開始火爆了,一下子就把我們的視野全部打開了,大家可以做的事情越來越多。我們在我們場景里面做視頻用的特別多,所以我們就開始深入研究,把我們能夠服務的ToB、ToC客戶全部掃描了一遍看看能做什么,后來再從某些方向快速地去試錯。
內(nèi)部也是分很多種聲音,但大家整體都是希望用ChatGPT真正地降本增效。而且讓你試錯的時間并不多,可能就是3個月的時間,能做就做下去,做不成可能就要撤。但是我們確實還是摸索出了一些路線出來,繼續(xù)去嘗試,現(xiàn)在看起來效果不錯。 比如,我們做了視頻的自動生成、游戲文案的自動生成、大規(guī)模的情報分析,以及關于用戶運營的一些技術,包括圖像的變換,一些虛擬人的技術,這方面做的還是比較多的。有些是我們用ChatGPT直接做,有些是在ChatGPT上面加一層LangChain的方式做一個相關的工作。這方面現(xiàn)在比較成熟,而且Lang chain現(xiàn)在也用得比較穩(wěn)定了。李江玕(主持人):從一個東西想做,到這個東西落地,你是不是感覺這些新的應用、新的場景、思路比以前快。郎君:對,我感覺比較快的原因有兩個,第一個是ChatGPT,它人人可用,它不像過去的元宇宙,大家知道云宇宙就是一個云里霧里的概念,跟我沒關系,只能看看這個Demo而已?,F(xiàn)在ChatGPT人人都可以去嘗試和探索,我就可以成為用戶了。這其實啟發(fā)了很多人的一些想象力,包括投資資本界也是這樣看的,一下子就暴漲,然后現(xiàn)在開始出現(xiàn)一個冷靜期,所以在漸漸的衰弱,但還是在反彈。所以我覺得確實很好用,而且現(xiàn)在這種AIGC開源社區(qū)非常的發(fā)達,不管ChatGPT還是其他領域里的核心工具,特別有一段時間每天都有海量的論文在爆發(fā),跟都跟不過來,就很痛苦了,現(xiàn)在相對好一點,但還是很不容易。這是我們的一些情況。張偉:我自己也是做自然語言處理的,我讀博士也是讀自然語言處理的,剛看到ChatGPT的時候我自己也體驗了一下,非常吃驚,感覺這個好像把我們以前學的那些東西都顛覆了,包含我們做的那些句法分析、信息提取的工作。我們現(xiàn)在還面臨著挑戰(zhàn),主要分兩部分,一方面針對自然語言理解,業(yè)務的特定模型表現(xiàn)不是很好,另一方面LLM大模型,針對業(yè)務場景,它的精力達不到我們的業(yè)務需求。但是你要真正到一個具體的商業(yè)問題上,還是有點Gap。因此我們需要做一些針對特定任務的小模型,然后再在一些大模型底座上去做再訓練。但是像電商這種場景,你首先要投入,而我又不是做一個云服務,這里面你就得想清楚它的應用在哪里。這種我們就剛開始講了兩個點,一個點是現(xiàn)在已經(jīng)有AI應用,現(xiàn)在的模型已經(jīng)還可以了,然后你換它的成本也很高。第二個是,做完之后它能不能跟我們現(xiàn)在這個業(yè)務匹配,其實也有一定分享,因為過去的系統(tǒng)已經(jīng)優(yōu)化很長時間了。LLM大模型如果在General的NLP Topic上,真的要對標,其實也是有優(yōu)有劣了。但是你如果再加一層業(yè)務含義,這個不確定性有點高。所以這里面就會對于我們來說有兩個思路,一個思路是有沒有一個應用可以驅動做這個事情,第二個是這個應用驅動完了之后,其他的那些應用是不是可以重寫。曹晟:我的心路歷程大致可以用一條比較出名的曲線形容,Gartner Hype Cycle。每次新的技術出來,大家的預期會非常高且不合理,然后到對于不能兌現(xiàn)的預期迅速失望,然后再回歸到合理預期并產(chǎn)品化Plateau的一個過程。我感覺我已經(jīng)過了這個高點和這個低點,然后到了這個Plateau的過程。現(xiàn)在這個股票市場可能是剛剛過了高點,最近市場的反應有一點cool down的。我是去年開始關注這個領域,一開始也是對它的涌現(xiàn)能力和AGI能力感到非常震驚,也問了很多身邊的大佬,有華人和非華人,大家都說它就像互聯(lián)網(wǎng)剛出來的時候,甚至比互聯(lián)網(wǎng)那會還稱得上是幾十年一遇的機會,所以當時是非常optimistic on this。后來在實際中做research和開發(fā)的時候,就發(fā)現(xiàn)非常難以在短時間做完美的產(chǎn)品化、商業(yè)化落地,特別是ToB或對accuracy、safety要求很高的產(chǎn)品,這方面不能保證這個產(chǎn)品落地。比如說金融領域現(xiàn)在還是slow to adopt,因為金融對于accuracy的要求太高了。多模態(tài)大模型這個長期trend還是在的,我也是一個AI的believer在這個情況下面,心態(tài)上面要更落地。在Generative AI 的時代,首先大家開發(fā)的思路會轉變,因為大家是從一個面向deterministic programming 過程,到面向一個 probability based 的過程,大家要去習慣這種轉變,很多事情不是絕對能去杜絕,或者是絕對能去證明。而是說在一個概率上面去收斂,或者概率上面去杜絕一個事情。第二,很多時候雖然大模型的能力非常強,但很多時候卡脖子并不在這上面,或者說還有很多繞過模型本身的方法,能更好的Boost 整個application的ROI。大家可以關注一下未來幾個月內(nèi)初創(chuàng)公司基于拿大模型做的一些產(chǎn)品應用,因為他們現(xiàn)在被賦予了用llama 2整個模型創(chuàng)新的能力。初創(chuàng)公司非常能拼搏一些新的idea,他們可以更好地找到瓶頸的地方到底在哪里,這些信息我們可以反饋到整個生態(tài)的搭建和商業(yè)化思考。李江玕(主持人):你剛才提到那個銀行,我們自己的一個東南亞銀行客戶,他們內(nèi)部已經(jīng)有十幾個應用在做了。但他們做的事情第一件事情就是說這個東西能不能本地化,本地化部署了之后,然后再做一些提效類,包括客服的抵消,內(nèi)部開發(fā)人員抵消,但是那個核心系統(tǒng)還是沒有碰到。曹晟:核心沒有能看到。金融行業(yè)比較特殊,它的商業(yè)化上限理論上特別高,但是往往現(xiàn)在技術方面還是在做的 cost reduction 上面其實并沒有真正把 AI 技術運用到金融上面賺錢那一塊,因為就是金融的it還是很小一塊。再就是,大家對于這件事情的看法也有不同,所以大家可能一開始還是在做sentiment scoring的系統(tǒng),因為這個可能更好的把它轉換成一個trading signal。但是在我看來,sentiment score這個東西很久以前就一直在做,我覺得只做sentiment score,并沒有很好的leverage大模型的能力,可能只用了一小部分,但是對于別的人可能更想看到這個東西能帶來實際經(jīng)濟上的利益,同時他本身的it人才又不像那個大廠那么多,這還是比較有挑戰(zhàn)的。李江玕(主持人):再問一個簡單的補充問題,你在硅谷里就直接請教了一些華人前輩,也有一些白人,這兩派對這個技術的看法,會有一些系統(tǒng)的差異?曹晟:華人和非華人在這上面的看法出奇的一致,都是非常看好。而且他們覺得這件事情肯定是一個revolutionary的事情。有些人的看法倒不是華人和非華人之間,而是看他之前從事的那個領域,現(xiàn)在是有一個AI security比較新的領域。但以前做security的那些大佬,他可能會對這個東西的suspicion會更多一些。他倒不是說質(zhì)疑它的能力,而是說質(zhì)疑在這個情況下面,人類可能不能很好地用這樣的Tool。最簡單的例子就是,它會帶來更多的一些不能 debug做的一些風險,或者說傳統(tǒng)的一些practice在這個模型下面可能就失效,然后可能大家還沒有準備好。比如說現(xiàn)很多不會寫代碼的人用大語言模型,或者說沒有系統(tǒng)受過這方面訓練的人用GPT去寫代碼,這是一件非常危險的事情,因為可能他不知道自己到底寫出來什么東西,然后有很多security的risk暴露出來,大致上是這樣的一個差別。李江玕(主持人):跟這個相關的問題,各位都在比較大廠的架構下面工作。這一塊的話,你在大廠可以投入很多資源去研究和嘗試這種東西。我現(xiàn)在做的是中小企業(yè),在這個方面不管是研究也好,還是感到焦慮也好,這方面大家有什么建議?在自己沒有什么資源的情況下,變化又這么大,有些場景可能對于創(chuàng)業(yè)公司來說的話,我沒抓住,這個可能就是生與死的挑戰(zhàn),大家在這點上面有沒有一些思考和一些建議?我們應該做些什么事情?或者說應該怎么去面對這個問題?張偉:ChatGPT出來之后,我發(fā)現(xiàn)還挺不錯的。我自己也在思考,如果我不是在大廠,我要自己做這個事情,如果要去做個創(chuàng)業(yè)公司,怎么做???
我自己思考了三條路,第一條路是在學術界中沿著這個方向做一些基礎的研究,跟政府或者是國內(nèi)的一些高校合作做一些更前端的研究,類似跟機器人的結合等。第二條路是自己創(chuàng)業(yè),基于ChatGPT做一些應用,比如數(shù)字人,這個方向有挑戰(zhàn),但發(fā)展得好也是一條新的商業(yè)賽道。第三個思路是在一個大公司里面的創(chuàng)業(yè)團隊,做一些應用。郎君:ChatGPT剛出來的時候,我們團隊并沒有很充沛的資源,自由去探索和發(fā)揮,我們一方面要把現(xiàn)有的工作做好,然后用業(yè)余時間摸索數(shù)據(jù),有些壓力也是給咱們特別新的意義。再說創(chuàng)業(yè),因為我自己還沒有創(chuàng)業(yè),我一直在想我要創(chuàng)業(yè)能干什么?這兩天在會場碰到很多以前的老朋友,很多都是創(chuàng)業(yè)者,有很多的信心,但我不一定要去創(chuàng)業(yè),但是我如果創(chuàng)業(yè)可能從這兩個方面下手,從現(xiàn)有的大公司的流程里面發(fā)現(xiàn)一些大公司可能做的不夠好的一些點,但大公司又不太愿意投入一個很專注的團隊專門干這些事情。那你去創(chuàng)業(yè)把這些事做了,用長尾效應的方式去收割所有大廠做的不好的點,這是一種常規(guī)的思路。第二種思路是,如果我們沒有在大廠里面工作,你可以去觀察你的生活,像巴菲特怎么買股票?可口可樂為什么不愛買?他生活中需要喝的就好,喝他就買了。從這種思路的話,可以觀察自己的生活周邊有沒有一些相對好的需求,可以用技術的方式去解決,或者用商業(yè)的方式解決,或者用產(chǎn)品的方式解決。這幾個方面,只要找到一個需求點就可以去突破。很多東西不一定是說我要全面的技術才能干這個事,但我有個商業(yè)模式創(chuàng)新也可以搞,電商搞一些,電商就干出來了,它并不是技術的創(chuàng)新,是模式的創(chuàng)新,所以我覺得創(chuàng)業(yè)還是很有機會的。在AIGC這個領域,我覺得AIGC創(chuàng)業(yè)這波還是會有很多做法。我們普通人沒有這么多的資源,有幾種方式可以解決?第一種,有一家公司是用CPU的方式來做GPU的事情,這種CPU的形式做到了成本很低。這方面是有巨大的空間的平臺,拿臺筆記本就可以干這種CV的事,就可以創(chuàng)業(yè)了。有些像做文本的技術,現(xiàn)在ChatGPT已經(jīng)開放了,大家用起來也很方便,也有很多的API的接入技術都可以去使用。其中的創(chuàng)業(yè)成本門檻已經(jīng)比以前低了很多,而且它的收費時間并不高,你幾十萬次才幾十塊錢,所以這里其實會做很多的東西,關鍵是要么從需求出發(fā),延伸性的做一些創(chuàng)新,要么從一個緊急的應用上,繼續(xù)加一塊磚也能產(chǎn)生巨大商業(yè)價值。曹晟:我講一下我自己的看法,我以前是學物理的,一直相信熵增定律?,F(xiàn)在是大家在一個信息上,一直在信息熵增和explode一個階段。這個帶來很多東西,我覺得他思考會和以前不一樣,首先企業(yè)的這個生命周期里面,企業(yè)的周期越來越短,同時做公司的怎么定義門檻,但是至少現(xiàn)在的公司比之前越來越容易,包括云計算等技術。當然這對創(chuàng)業(yè)是一個利好,又是不利好的情況??赡芎芏囗椖科饋砗芸?,但有些公司因為ChatGPT的事情,它又受到了一些影響。到時候大家能看到很多企業(yè)周期變化,新老交替迭代或者業(yè)界發(fā)展都非常快,我覺得大家可以去accept這個事實,也不用焦慮,首先有很多機會,同時也有很多競爭對手。有很多事物是可以被顛覆。大家只要接受這種模式的話,我覺得就是可以走出一條路的。李江玕(主持人):我記得4月份的時候,當時在國內(nèi)一家公司做拜訪,那個時候我們剛開完記錄總結會,我說總結出一點,珍愛生命,遠離大模型。我說什么意思?他說你做的東西不能夠在大模型的能力的延伸線上,這樣的話可能會很快死。那我在想UGIC可能跟國內(nèi)的一家大廠有關系。以前的想法是做任何東西不要在大廠的延伸線上,因為大廠很容易復制能力,這對于創(chuàng)業(yè)者來說其實是很難的,要做的也只是那個需求大盤本身自己做起來很難受的一些需求,那么可能這個比較好。剛才張偉你提到一點創(chuàng)業(yè)的想法,當然我們也知道現(xiàn)在的這種環(huán)境都不好,從shopee的角度或周圍一些朋友的角度來講的話,你會鼓勵大家去創(chuàng)業(yè)嗎?張偉:我有個同事也在問我,因為我以前是做NLP的,他不是做這塊的,他問這個有沒有機會?我勸他謹慎一點,還是在大廠待著好一點。他只是有一個比較懵懂的idea,所以這個就挺難的。而且大模型也有大廠開源的了,所以你去創(chuàng)業(yè),一是資金拿不到,二是很難做一個盈利模式出來。有些同事之前做一些客服的機器人,然后接到電商里面,它這個東西不用大模型之前也有盈利模式,用了大模型之后體驗更好,或者是整個對話效應更好,因為現(xiàn)在的大模型API的成本也比較低,用大模型迭代的現(xiàn)有應用還是挺好的。還有數(shù)字人,現(xiàn)在的需求量是在那的,只要你的技術做得好,是有人用的。比方說一個直播它就24小時在那掛著,還是挺好的,開直播就相當于是免費的,這樣帶來的流量也是客觀的。這個流量不像廣告一下需要付費。雖然大家覺得數(shù)字人流量不如真人,但是從商業(yè)的角度上還是有一個利益點的,這個創(chuàng)意還挺好的。如果做大模型底座的創(chuàng)業(yè),現(xiàn)在確實是風險很大,有些朋友去創(chuàng)業(yè),起初他們出去的時候拿種子輪融資的時候環(huán)境還挺好,現(xiàn)在就很難拿到融資了。李江玕(主持人):我之前有個投資人朋友見了更多的創(chuàng)業(yè)者,他總結出來說,創(chuàng)業(yè)者最開心的狀態(tài)是兩個時候,第一個是產(chǎn)品上線前,即第一版產(chǎn)品上線前,第二個是剛拿到的融資還沒有到賬,中間這個過程是最開心的,之后就很不一樣了。你們剛才提到的那個數(shù)字人,其實最近在東南亞市場有很多人在關注,就是TikTok電商的發(fā)展,我們也是聊了很多這個行業(yè)從業(yè)者上,因為在直播這個方面人員的投入還是挺大的,尤其是在東南亞大家覺得人員的效率跟中國比是有差距的,所以大家討論數(shù)字人比較多,但是可能就是在實際應用上還比較少一個東西。大家對這個怎么看?張偉:我自己不止數(shù)字人,包括國內(nèi)接受度比較高其他AI應用,類似一些智能化運營工具和數(shù)字化的業(yè)務看板,東南亞這邊都還處于初期,這些應用接受度需要慢慢發(fā)展。所以包括數(shù)字人在內(nèi)的智能化運營工具都還是處于萌芽期。雖然現(xiàn)階段規(guī)模小,接受度低,但是發(fā)展空間還是不錯的,第一個是消費者端電商市場滲透率,第二個是商家側的運營能力跟國內(nèi)拉齊。隨著這兩部分的發(fā)展,數(shù)字人以及數(shù)據(jù)驅動的運營工作等都是有很大的市場的。國內(nèi)給商家提供第三方運營的公司,有很多,但是東南亞這邊其實還較少。在一個成熟市場去做技術創(chuàng)新,這件事情是一個思路。在一些發(fā)展初期市場再去做這件事情,隨著市場成熟,機會也會更多,所以我覺得數(shù)字人在這還可以的。另外,我覺得數(shù)字人比國內(nèi)好一點,在東南亞的真人直播質(zhì)量和數(shù)字人的差距沒國內(nèi)那么大,這個也算是個優(yōu)勢。李江玕(主持人):對于消費來說的話,TikTok本身是一個就是廣告投放渠道本身,但本身也是一個電商的競爭對手,歷史上大家都認為就是TikTok的廣告的轉化率比Meta 跟谷歌都要低的,原因是什么?目前包括數(shù)字人、辦公情況會給這個行業(yè)帶來什么樣的變化?曹晟:TikTok的轉化率比Facebook、谷歌要低。一個在TikTok做Monetization的朋友說,TikTok的轉化率是Facebook的一半,但這個數(shù)據(jù)沒有考證。在我個人看來,主要原因是在做廣告投放上面。在傳統(tǒng)廣告投放上面,短視頻的信息密度,還有轉化率要低過信息流的。像谷歌、Facebook,它們基本還是一個以信息流為主的產(chǎn)品,短視頻是它們的一部分,但是TikTok是以短視頻為主的一個產(chǎn)品,短視頻的粘度非常高,所以不做短視頻的話,session time肯定會被短視頻搶走,但是整個短視頻的monetization效率是低過信息流這類產(chǎn)品。然后數(shù)字人我確實不太了解。這個是指經(jīng)常掛在這個平臺上,24小時的一個電商直播,它是一個虛擬人嗎?李江玕(主持人):國內(nèi)現(xiàn)在還有很多這種,就淘寶上的賬號,它其實都是掛著直播的,但往往是有一個人在那邊,可能也不是特別活躍。但是現(xiàn)在有了這樣的技術,可能以后你不需要雇一個人在那,然后你可以同時用處理的方式在不同的渠道完成直播中的時效。曹晟:那他就是不同數(shù)字人,因為每個商家都有自己的一個直播頻道,他怎么去跑出來呢?如果一個用戶他剛進入到整個平臺上,想要找到類似還是需要一個檢索或者推送的方式。這部分可能還是需要廣告推送讓他更容易跑出,一旦它有這個綁定之后,可能就成為深度轉化,那個時候它就不需要這個持續(xù)的廣告推送,它就會綁定這個channel,然后通過數(shù)字人去讓它持續(xù)轉換。郎君:我補充一下數(shù)字人或者虛擬人。這個在游戲里面已經(jīng)很多年了,它叫NPC。比如說你打王者榮耀,突然之間有個人下線了,可以有個機器人代替,大家可以感覺不到,那這機器需要匹配機制,你需要這個機器人比你強很多還是比你差很多,有時候你跟一個很強的人打了幾局,你就進步了,但一直被虐你就不想玩了,你跟一個很差的人打一會沒意思,也不打了。所以這里面匹配是很復雜的。在虛擬直播里面其實也是這樣,有時候你到一個店里面,如果這個直播講得很好,互動很好,這個機器人調(diào)得很好,你就隨便買東西了。如果你跟機器人聊了半天,聊不上來,體驗不好之后就不買了,直接走了。所以這個虛擬人的技術,我覺得它不只是個聊天機器人,可能還有那種表情、動作、手勢,還有廣告的技術,心理學怎么去設置,非常非常復雜。我覺得做好了還是有極大的前景。李江玕(主持人):所以這個行業(yè)還是有很多的可能性的問題的。今天的時間也差不多了,接下來我們大概有15分鐘的休息時間,3點半我們將進入下一個議題,感謝三位嘉賓的精彩分享。
本站僅提供存儲服務,所有內(nèi)容均由用戶發(fā)布,如發(fā)現(xiàn)有害或侵權內(nèi)容,請
點擊舉報。