在我前一篇關于 TikTok 的文章中,我們探討了 TikTok 的個性化推薦算法 FYP 作為連接組織運轉(zhuǎn)的核心原因,它就好像汽車總線一樣,控制連接并形成信息傳輸?shù)拈]環(huán)。
但多數(shù)人還是非常費解,為什么很多公司想要收購 TikTok,另一方面,字節(jié)跳動是否應該將 TikTok 這一備受歡迎的 App 賣掉。圍繞 TikTok 算法大肆的炒作已經(jīng)開始變的異化了,這也是如今西方對中國科技領域項目的普遍分析套路。
在這篇文章中,其實我想探討一下 TikTok 的設計是如何讓它的算法如虎添翼的。之前我有寫過 FYP 算法作為 TikTok 核心的原因,也講到,假如這一核心算法不起作用了,那么整個信息傳輸閉環(huán)就會崩潰。即使你對 TikTok 或短視頻不感興趣,了解其算法如何實現(xiàn)準確性匹配對你也很有幫助,因為越來越多的行業(yè)公司將會遇到以機器學習算法為武器的競爭對手。
給大家推薦一本書,詹姆斯·C·斯科特(James C. Scott)的《國家的視角》(Seeing Like a State),它可以將你的思維轉(zhuǎn)變成硅谷人的思考方式,讓你喜歡使用甚至濫用 legibility(讀懂)這個術語。我也是在讀了一篇卡塔什·拉奧(Venkatesh Rao)對這本書的總結性文章時了解到的,如果你不打算讀原書的話,Rao 的這篇文章倒是可以推薦作為這本書的 tldr(Too Long; Didn't Read,化繁為簡的替代方案)。斯科特·亞歷山大(Scott Alexander)對本書的書評也很好,而且非常長,比較詳細,也可以作為該書的一篇 tldr。不過我還是建議你讀下原著。
這本書能讓人們清晰的認識到到日常生活中各種意想不到的后果。當我們太過驕傲自大時,都應該保持謙遜的姿態(tài)。世界比我們想象的更加豐富和復雜。
舉個例子,斯科特研究的很多內(nèi)容都與我們現(xiàn)在傲慢的社交網(wǎng)絡巨頭有關。這些占據(jù)市場主導地位的應用程序旨在提高用戶群的可識別性,從而提高用戶參與度,防止用戶流失,并最終提供有針對性的廣告服務。當然這些反過來也會給它們的母公司帶來一些問題。
但這是另一個話題,之后我在別的文章中再探討。斯科特關注的是國家如何使用簡化的抽象概念在概要層次上“看到”其公民,而我想討論的是 TikTok 的應用程序設計如何讓它的算法“看到”所有需要的細節(jié),從而高效、準確地執(zhí)行其配對分發(fā)工作。如果說《國家的視角》研究了常見失敗案例模型,這篇文章便是介紹通過程序和服務的設計使機器學習算法發(fā)揮最大價值的新模型。
近年來,至少對于像我這樣的局外人來說,大家對機器學習的一個普遍認知是,僅僅通過將訓練數(shù)據(jù)量增加幾個數(shù)量級就可以取得很大的進步。也就是說,即使算法本身與幾年前沒有什么不同,僅僅通過在更大的數(shù)據(jù)集上訓練算法,人工智能研究人員便能取得像 GPT-3 這樣的突破(這給科技巨頭 Twitter 帶來了短暫的興奮)。
當大家談及 TikTok 的算法是其成功的關鍵時,便會認為該公司的秘密武器是一些神奇的代碼。俄羅斯后現(xiàn)代主義作家維克托·佩列溫(Viktor Pelevin)曾說過,所有現(xiàn)代電影的主角都是一個裝滿錢的公文包。從《死吻》(Kiss Me Deadly)的放射性物質(zhì)公文包,到《低俗小說》(Pulp Fiction)里面的那個類似的里面金光閃閃的、不知道裝著什么的公文包,從《魔頭對捕頭》(The Formula)的創(chuàng)世紀方程,到大衛(wèi)·馬梅特(David Mamet)的《西班牙囚犯》(The Spanish Prisoner)里面的秘密財務流程,我們長期以來一直對有魔力的麥格芬(McGuffin,推動情節(jié)發(fā)展的對象或事件)感到癡迷。最近幾周,我們對 TikTok 算法的討論已經(jīng)把它提升到了類似的高度,這個算法就好像是《奪寶奇兵》系列電影(如《法柜奇兵》(the Ark of the Covenant)、《圣戰(zhàn)奇兵》(the Holy Grail)、《魔宮傳奇》(lingam Shivling))里面的那些神秘考古文物一樣。
但該領域的大多數(shù)專家持懷疑態(tài)度,TikTok 在機器學習推薦算法方面并未取得外界未知的突破性進展。事實上,他們中的大多數(shù)人認為,TikTok 很可能就是基于標準方案解決的問題,跟其他方案無異,沒有什么特殊性。
不過機器學習算法的有效性并不僅僅取決于算法本身的函數(shù),還取決于數(shù)據(jù)集訓練后的算法函數(shù)。GPT-3 并不是新創(chuàng)意,但是通過大量數(shù)據(jù)訓練和大量的參數(shù)設置,它的輸出結果往往是令人驚訝的。
同樣道理,基于自身數(shù)據(jù)集訓練過的 TikTok FYP 算法,在將視頻與覺得該視頻有趣的人進行匹配方面做的非常精確和高效(而且,反向匹配做的也很精確,對某些視頻不感興趣的人就不會接收到這些視頻) 。
對于某些領域,比如文本相關性較大的領域,可以輕松獲得大量訓練得很好的數(shù)據(jù)。例如,要訓練一個像 GPT-3 這樣的人工智能模型,你可以到互聯(lián)網(wǎng)、書籍等上面找到大量可用的文本集。如果你想訓練一個視覺人工智能模型,你可以在網(wǎng)上和各種數(shù)據(jù)庫里面找到大量照片。雖然訓練非常費錢,但是至少你可以獲得足夠的訓練數(shù)據(jù)。
但對于 TikTok(或中國版抖音)來說,他們需要一種能夠出色地向觀眾推薦短視頻的算法,而這樣龐大的公開可用訓練數(shù)據(jù)集是不存在的。你在哪里可以找到各種各樣的惡搞、孩子們跳舞、假唱、有可愛寵物、名人品牌推廣、士兵們穿越障礙球場、孩模仿品牌等類型的視頻呢?即使你有這樣的視頻,你從哪里可以找到關于一般民眾對這樣的視頻看法的比對數(shù)據(jù)?除了 http://Musical.ly 的數(shù)據(jù)集以外(主要是由美國十幾歲的女孩對口型唱歌的視頻組成),這樣的數(shù)據(jù)并不存在。
在經(jīng)典的“先有雞還是先有蛋”的問題中,如果沒有 App 的相機工具和過濾器、授權的音樂剪輯等,TikTok 算法需要訓練的視頻類型并不容易創(chuàng)建。
這就是 TikTok 設計的神奇之處:它是一個反饋的閉環(huán),這種設計能夠激發(fā)并實現(xiàn)視頻的創(chuàng)作和觀看,產(chǎn)生的數(shù)據(jù)進而通過其算法進行訓練,之后再反過來激發(fā)創(chuàng)作和觀看。
為了讓 TikTok 的算法變得像現(xiàn)在這樣有效,TikTok 成為了它自己的訓練數(shù)據(jù)來源。
要理解 TikTok 是如何創(chuàng)造出如此強大的學習飛輪的,我們需要深入研究它的設計。
說到技術領域的 UI 設計,至少在我成長的 20 年里,主流思想始終圍繞著如何消除用戶在完成他們想做的事情時的阻礙,同時在這個過程中讓他們高興。設計的終極目標是優(yōu)雅,換個說法是要設計的:直觀、巧妙、甚至時尚。
這種設計流派的代表公司便是蘋果。巔峰狀態(tài)下的蘋果總能把自己的軟硬件做出優(yōu)雅的感覺——“就是這么好用(it just works)”,但同時又很性感,讓用戶感覺有品位。在蘋果的主題演講上發(fā)布新的 MacBook Pro 機身時,為什么要專門播放一段視頻,展示它是如何用一塊實心的鋁制作而成的?可能是因為看到工業(yè)激光把那塊鋁雕刻成一體化機身會讓你感覺很酷?然后,當你在咖啡店里用筆記本電腦發(fā)郵件時,那段視頻的一些殘留記憶又會在潛意識里給你一點點觸動?
這種以用戶為中心的設計模式占據(jù)主導地位如此之久是有原因的,尤其是在消費技術領域。首先,這確實有用。據(jù)最新統(tǒng)計,蘋果的市值超過了 2 萬億美元。(還記得 Sean Parker 說過有十億美元很爽嗎?那還是十年前,現(xiàn)在十億美元不再是頂層了。財富的量級在飛速發(fā)展。)此外,我們生活在大規(guī)模網(wǎng)絡效應的時代,科技巨頭們運用本·湯普森(Ben Thompson)的聚合理論,獲得了龐大的用戶基礎,可以對他們所參與的市場發(fā)揮難以置信的影響力。要做到這一點,最好的方法之一就是設計比競爭對手更好地滿足用戶需求的產(chǎn)品和服務。
這種設計流派主導了這么長時間,以至于我?guī)缀跬浟酥按蠹页S玫囊恍┳玖拥能浖O計方法了。
但是,如果為用戶提供最好服務的關鍵,很大程度上取決于機器學習算法的訓練會發(fā)生什么呢?如果這個 ML 算法需要大量的訓練數(shù)據(jù)集怎么辦?在一個機器學習占據(jù)主流的時代,這越來越成為一個關鍵的設計目標。
在考慮如何設計一個應用程序時,你將越來越多地需要考慮怎么才能最好地幫助算法去“看”。要想更好地服務你的用戶,首先需要服務好你的算法。
TikTok 之所以讓我著迷,是因為它是一個現(xiàn)代 App 的典范,這就是我所謂的算法友好型設計的范本。(我曾經(jīng)想過把它叫做以算法為中心的設計,但覺得這種說法有點夸張了。一個幫助算法看見東西的設計到頭來仍然是為了給用戶提供盡可能好的體驗。)
我們?nèi)匀豢梢哉J為這只是以用戶為中心的設計的一種變體,但是對于那些大量采用機器學習算法組件進行產(chǎn)品開發(fā)的團隊來說,明確地承認這一點可能是有用的。畢竟,當產(chǎn)品經(jīng)理,設計師和工程師開會討論 App 設計時,算法是不會出席的。但是,對算法的訓練需求必須得到體現(xiàn)。
詹姆斯·斯科特(James Scott)的《國家的視角》談論了城市設計等領域的巨大變化,比如讓土地面積和業(yè)主數(shù)量對征稅者“清晰可見”。TikTok 的設計使它的視頻、用戶和用戶偏好對它的 For You Page 算法清晰可見。該應用程序的設計實現(xiàn)了它的主要職責之一:“像算法一樣看事物。”
我們不妨仔細看看。TikTok 打開后就是“For You Page”頁面,然后直接進入視頻。這就是它的樣子。
整個屏幕被一個視頻填滿。只有一個,它以垂直方向全屏顯示。注意,這是不能滾動的,而是分頁。視頻幾乎是立即自動播放(接下來的幾個視頻是在后臺加載的,這樣當輪到它們的時候,它們也可以快速播放)。
這種設計會促使用戶立即思考一個問題:你對此刻你面對的這段視頻有什么感覺?
從視頻開始播放的那一刻起,你所做的一切都是你對該視頻感受的信息。你會在視頻還沒播放完的時候就刷到下一個視頻嗎?是的話就隱含表示你對它不感興趣(雖然不明確)。
你是不是看了不止一次,讓它循環(huán)播放了好幾次?似乎不知道什么原因它就吸引了你。你有沒有通過內(nèi)置的分享面板分享這段視頻?這是正面情緒的另一個有力指標。如果你點擊右下角旋轉(zhuǎn)的 LP 圖標,看了更多有著同樣背景音樂的視頻的話,就表明該視頻對你胃口的進一步信息。音樂線索往往是模因的代名詞,現(xiàn)在 TikTok 又有了一條為你推薦視頻的軸線了。還有,你打開了視頻制作者的個人資料頁面了嗎? 你看了他們的其他視頻了嗎,之后你關注了對方嗎? 是的話,說明你除了欣賞視頻以外,也許你特別喜歡他們這些人。
但是,讓我們往早一點回顧一下,在你看視頻之前,TikTok 算法是如何“看到”視頻本身的?其實,在這個視頻通過 FYP 算法發(fā)送到你的手機之前,TikTok 的運營團隊有人已經(jīng)看了這個視頻,并添加了大量相關標簽或標記。
這個視頻是跟跳舞有關的嗎?是對口型?還是視頻游戲?有小貓嗎?還是花栗鼠?是搞笑的嗎?主體是男的還是女的?大概幾歲?是群視頻嗎?背景在哪里?用的是什么濾鏡或視覺效果?如果里面包括有食物,是什么食物?等等。所有這些標簽都成為了算法現(xiàn)在可以看到的特征。
視覺人工智能也會對視頻進行處理,并在一定程度上貢獻它看到的內(nèi)容。TikTok 的一些相機濾鏡能夠追蹤人類的臉、手或手勢,所以視覺人工智能往往在視頻被創(chuàng)建出來之前就被調(diào)用過了。
這個算法還可以看到 TikTok 所了解到的有關你的信息。你過去喜歡看什么類型的視頻?有關你的人口統(tǒng)計學信息或心理學信息有哪些?你是在哪里看這個視頻的?你用的是什么類型的設備?等等。除此之外,還有哪些其他用戶跟你相似?
我們不妨回到你在手機上用 TikTok 看視頻的那一刻。FYP 算法現(xiàn)在可以關閉所有的反饋回路形成閉環(huán)了。它通過你對視頻的每一個動作來猜測你對這個視頻的感受,以及它的所有屬性。
上述所有的步驟都不是像火箭科學那樣的硬核技術,尤其是對于那些從事社交算法研究的人來說這些并不新鮮。在我之前的文章中,我說過 TikTok 并沒有真正強大的社交圖譜。這款應用之所以有如此效果,原因之一是它不會假裝自己不是的東西。也就是說,人們已經(jīng)有了許許多多其他的社交網(wǎng)絡和與他們認識的人分享的方式。他們沒有強迫人們在 TikTok 應用程序中下載視頻,而是讓通過外部渠道下載或分享視頻變得非常簡單。不過,TikTok 想保留的是你選擇分享視頻這一行為數(shù)據(jù)。這個數(shù)據(jù)就能(也只能)滿足他們的算法需求。由于這些視頻都帶有水印,所以它們也可以通過分享獲得免費的宣傳。實際上,TikTok 之前發(fā)表了一篇博客文章,主要描述解釋了他們的 FYP 算法工作機制, 我相信大家只要是做軟件技術的,看過之后都知道其中并沒有什么新鮮的創(chuàng)造。
但是,把 TikTok 的 FYP 算法所看到的東西,跟其他大多數(shù)社交網(wǎng)絡動態(tài)消息的推薦算法所看到的東西對比一下,你就會發(fā)現(xiàn)它們不一樣在哪里了。
如今,我們最大的社交網(wǎng)絡的默認 UI 是無限的垂直滾動 feed(例如,上面 Facebook 的截圖)。這些應用程序不是一次為你提供一個故事,而是在屏幕上同時顯示多個項目。當你向上滾動并經(jīng)過許多故事時,算法無法“看到”你的眼睛所注視的是哪個故事。就算能看到,如果用戶沒有按“點贊”之類的反饋按鈕的話,他們對故事的感覺是正面的還是負面的?實際對用戶情緒的判斷并不清晰。
如果你認同 UI 應該消除溝通阻礙的想法,無限滾動 feed 可能是理想的方案選擇。它提供了一種對消費節(jié)奏的無拘無束的控制感。
在分頁設計中,你一次只能看到一個故事,而手指每推一次只能讓 feed 滾動一條,這無論在字面上和還是隱形數(shù)據(jù)獲取上都是一種累贅。
另一方面,如果 Twitter 更有針對性的話,也許你不會介意一次只看一條 Twitter;如果 Twitter 知道更多你真正感興趣的 Twitter 類型,也許它們會更有針對性。如果你必須在每條推特上給出明確或含蓄的正面或負面信號,Twitter 也許就能更好地了解你真正感興趣的內(nèi)容。
即便在有用戶參與的互動故事中,判斷用戶的情緒也不是一件簡單的事情。大多數(shù)應用程序只有正面的反饋機制,最典型的是某種形式的 like 按鈕。由于像 Facebook、Instagram 和 Twitter 這樣的應用程序都是基于社交圖譜開發(fā)的,因此它們可能會選擇不提供“不喜歡”按鈕。
但是,就像史蒂芬·金在《寫作這回事》(On Writing)里面所寫那樣,“如果你希望成為一名成功的作家,無禮應該是你最不應該關心的第二件事。而你最不應該關心的第一件事,正是這文明社會和它對你的期許。如果你有心真誠地寫作,你作為上流社會一員的日子屈指可數(shù)了?!?/p>
Facebook、Twitter 和 Instagram 等社交網(wǎng)絡依靠的是帶有明確的正面反饋機制的長滾動信息流,因此在用戶更傾向于低阻礙閱讀的同時,也犧牲了對負面信息更準確的解讀。在創(chuàng)始人和 CEO 是同一個人的公司里,你會看到這種權衡的另一個變體:這樣的人往往在自己身邊有一群高管,他們聽從他們的領導,和他們相處得很好。被一群唯唯諾諾的人包圍的危險在于沒有任何人來挑戰(zhàn)你思維中的盲點。我們總是有必要問一下,誰有足夠的權力,能夠真正改變像貝佐斯、庫克、扎克伯格和馬斯克這樣的人的想法。答案往往是沒有人,所以他們的盲點成為公司的盲點。
像 Reddit 這樣建立在興趣圖基礎上的網(wǎng)絡,確實有吸納踩(down voting)機制的傾向,因為他們阻止用戶流失的主要方法是為他們提供最有趣的內(nèi)容。這意味著要剔除乏味的內(nèi)容,就像它要展示吸引人的內(nèi)容一樣。
TikTok 沒有顯式 downvote 按鈕,但是通過每次只提供一條視頻,他們可以從你是不是很快就略過不看,以及你沒有做某一項積極舉動來推斷你是否對某條視頻不感興趣。
如果你點擊了某人在 Facebook 上發(fā)布的一篇文章,但不做評論或者點贊的話,F(xiàn)acebook 怎么能判斷你對這篇文章的看法呢?也許你想過在評論中表示強烈的不同意,但是這個人恰恰是你的同事或朋友的朋友,然后你便會決定還是不說為妙。這種負面情緒很難捕捉,算法不能“看到”你的感受。
乏味或引起輕微不快的內(nèi)容才是慢性殺手。在我之前的文章中,我提到過,由于你自己的興趣和你認識的人的興趣不匹配,社交圖上的內(nèi)容可能會偏離用戶的真正興趣。從按時間順序提供信息到按算法提供信息的轉(zhuǎn)變,通常是針對這種波動的默認防御措施。
但是,如果算法不能“看到”用戶越來越不感興趣的信息,只能看到用戶參與的正面信息的話,內(nèi)容和用戶興趣不匹配的情況就不可避免。你之后可能會發(fā)現(xiàn)用戶慢慢地失去了興趣,不再喜歡看那么多東西,不再經(jīng)常打開你的應用,但是究竟是哪條 feed 讓他們離開你還不清楚。當用戶表現(xiàn)出要離開的跡象時,通常已經(jīng)太晚無法挽回了。
對算法友好的設計不一定對用戶不友好。它只是采用了不同的方法來滿足用戶的興趣。分頁可能會給用戶帶來某種程度的阻礙,但這樣做可以為算法提供更詳細的信息,從而在長時間內(nèi)保障 feed 的質(zhì)量。
最小化阻礙只是獲得良好用戶體驗的一種方法。任何設計的目標都不是減少阻礙,而是幫助用戶達到某種目的。減少阻礙通常與這一目標相一致,但并不總是如此。你可能會說,引用推文減少了手動復制他人推文的阻礙,但如果你的目標是 和諧文明的公共討論的話,那么減少噴子涌到某人推文底下瘋狂攻擊的阻力也許并不是你要鼓勵的核心機制。所以有些形式的阻礙是好的。
你有沒有聽說許多有影響力的 Twitter 大 V 用戶建議其他人盡早把禁言和屏蔽功能使用起來。還有一些用戶甚至大量使用軟屏蔽功能來秘密拉黑關注者。
有些用戶會故意地在推特上發(fā)布自己禁言了哪些詞的屏幕快照,以表示他們對某些熱門話題的不滿(或者他們對所討論話題的智商優(yōu)越感)。有些人更加極端,甚至取消關注所有人,然后重新關注。有時候,可能因為 A/B 測試良好,Twitter 會向用戶展示自己關注的人點贊的推文,甚至是用戶自己沒有關注過的人的推文。這種做法確實偶爾會展示出一些我感興趣的推文,但從絕對意義而言,這樣增加了我不感興趣的推文的數(shù)量,我不得不滾動過去。沒有兩個人有完全相同的興趣愛好。這個功能的發(fā)布讓我開始考慮取消關注所有人,然后再重新關注,但我也擔心會傷害別人的感情,因為我是一個軟心腸的人。如果 Twitter 的做法有所改變的話,這就不是問題了。
我有時也會考慮采用其中的部分甚至全部策略,但對于 Twitter 來說,這些策略的存在性本身就是產(chǎn)品設計的失敗。如果算法能準確的分辨出什么是你感興趣的東西的話,它應該去做些替你禁言主題或者拉黑一些人的事情,而不用你再煩心這些事情。正如我上次所寫的那樣,你必須在 Twitter 上關注所有人才能獲得有趣的內(nèi)容,很多人認為這是基于強大的社交圖譜設計的一個缺陷。
TikTok 不僅能明確的捕捉到用戶的情緒信息,還能通過每次交互收集大量信息。TikTok 的視頻是比較短的,但即便在這樣短暫的交互中,TikTok 也能收集到很多關于你喜好的反饋。
這個過程也是比較簡單的,即便最讓用戶感覺不舒服的情況,也就是多推送了幾個他們不喜歡的視頻,用戶直接劃掉即可,非常方便。用戶甚至會很享受這種操作,因為他們知道基于算法的反饋機制會記錄他們的行為并作出反應。短視頻正好是非常適合此類機器學習驅(qū)動型推薦的類別。
但這并不意味著它適用于所有類型的類別。音樂很合適,時間不長,采樣成本低,重復消費的價值高,而且音樂的相似性通常是可以利用數(shù)學進行計算的。Spotify Radio 推薦給我的音樂就很可不錯。不過電影的算法推薦對我來說從來都沒起過作用,電影很長,采樣成本很高,語料庫也很小,每年只有大約 500 部電影上映,而大多數(shù)人只看了其中的一小部分。這整個話題可以單獨發(fā)表一篇文章再討論。
順便說一句,TikTok 并不是唯一一款針對匹配目標對界面進行優(yōu)化的應用程序,這里指每次只展示一個頁面,從而可以更清楚地分析出用戶感受的應用程序;在 TikTok 之前,單頁展示一項內(nèi)容的 UI 設計已經(jīng)比較流行了。
向右滑和向左滑成為表示認可和不認可的代名詞是有原因的。Tinder 在觸摸屏 UI 上設計了一個類似于二進制投票的原始設計。
在這個軟件時代,真正的競爭優(yōu)勢,或者你產(chǎn)品的護城河,正變得越來越虛幻。大多數(shù)軟件功能或 UI 設計都可以在一夜之間輕易地被同類產(chǎn)品或競爭對手復制。先行者做的很多事情都是替他們試試水而已。有一次我去中國的的時候,曾經(jīng)跟一幫中國的企業(yè)家共進晚餐,我提到了 Instagram 抄襲 Snapchat 的 Stories 引起的爭議。一家中國頂級公司的首席產(chǎn)品官笑著說:“在中國,如果你的競爭對手在兩周之內(nèi)不能把你的某項成功的功能復制出來的話,那么他們是不足以作為競爭對手的?!?/p>
硅谷自以為是創(chuàng)意市場的達爾文主義者,但種種跡象表明,中國的科技界才是的真正的達爾文主義;這對硅谷的相對產(chǎn)出來說是個壞兆頭,因為在中國觀念傳播和變異的速度更快。人們通常說硅谷已經(jīng)替代了波士頓的 128 號公路(Route 128)(曾經(jīng)的電子工業(yè)中心)成為技術創(chuàng)新的地理中心,部分原因是硅谷更開放的勞動力市場允許創(chuàng)意在公司之間自由流動。中國采取了同樣的做法,并且更加完善了這種策略。想要在競爭激烈的中國科技行業(yè)中生存下來,就像是想要從《黑暗騎士崛起》里面的那個坑里面爬出來一樣——很恐怖。
但如果你能創(chuàng)造出像 TikTok 那樣的飛輪,那么像 Reels 或 Triller 這樣的競爭對手就很難趕上你了。Triller 可能會花錢把 TikTok 的一些網(wǎng)紅挖過來制作視頻,Reels 可能會嘗試從 Instagram 引流,但 TikTok 之所以能成功是因為高效的 FYP 算法把創(chuàng)作者、視頻以及觀看者連接成一個正向的反饋回環(huán)。
在科技行業(yè),布賴恩·阿瑟(Brian Arthur)提出了經(jīng)濟的報酬遞增與路徑依賴理論,在這個行業(yè)當中,第一個實現(xiàn)產(chǎn)品市場匹配的競爭對手可能會脫穎而出。在一個日益緊密相連的世界里,市場給人的感覺是越來越贏家通吃的。
字節(jié)跳動往往被說成是一家算法公司,而 TikTok 在過去幾周被認為是靠這種算法的黑魔力才取得的成功;很多人甚至認為,如果收購條款中不包含算法在內(nèi)的話,TikTok 就不值得購買。
在我看來,這個觀點是錯誤的。我并不是認為算法不重要,的確,重新訓練 FYP 的推薦算法可能需要很長時間,甚至這期間會導致部分用戶流失。但是,真正有價值的在于 TikTok 的設計和流程里面的每一個元素是怎么互相關聯(lián)到一起,從而創(chuàng)建出一個數(shù)據(jù)集,再通過這個數(shù)據(jù)集,把算法訓練成最佳性能的——這個反饋回環(huán)里面沒有一步是超出了美國眾多工程師的能力范圍的,我們所需要的就是理解這個飛輪是如何工作的,并保證讓每一個元素和流程都正常運轉(zhuǎn)。
我遇到過的一些產(chǎn)品或服務似乎在算法推薦的質(zhì)量上都遇到了天花板:這里面包括 Yelp、OpenTable、Google、Netflix 等;不要誤會我的意思,這些公司很多都已在舒適區(qū)了,我只想讓他們的產(chǎn)品可以更上一層樓,對算法更友好的設計也許就是有效的解決方案之一。
回顧一下,在我關于 TikTok 的系列文章的第一篇當中,我討論了該算法如何作為一種匹配機制,使 TikTok 成為一個可伸縮的娛樂網(wǎng)絡。相比之下,社交網(wǎng)絡必須使用社交圖譜來做興趣圖譜的事情,這就帶來了很多問題。在關于 TikTok 的第二篇文章中,我著重介紹了它的設計如何幫助它的機器學習 FYP 算法“看到”它需要看到的東西,從而有效地完成它的工作。對算法友好的設計理念可能會成為其他垂直領域的公司如何在機器學習時代取得優(yōu)勢的一種模式。
TikTok 的案例之所以那么的迷人而且異類,還有最后一個原因。這一點與軟件和算法關系都不大,而與我孜孜不倦研究的文化決定論有很大的關系:創(chuàng)意的網(wǎng)絡效應。這將是我關于 TikTok 系列文章的第三篇,也是最后一篇文章的主題。
英文原文鏈接:
Seeing Like an Algorithm
https://www.eugenewei.com/blog/2020/9/18/seeing-like-an-algorithm
InfoQ 寫作平臺歡迎所有熱愛技術、熱愛創(chuàng)作、熱愛分享的內(nèi)容創(chuàng)作者入駐!
還有更多超值活動等你來!
掃描下方二維碼
填寫申請,成為作者
聯(lián)系客服