2012年由張一鳴創立的字節跳動(ByteDance)是近年來最具全球影響力的科技公司之一,業務包含各種網路服務,如遊戲、教育、企業生產力、支付等等。但最主要還是靠3大事業體:頭條、抖音和TikTok(抖音國際版)。

這些事業能欣欣向榮,受惠於其核心技術:推薦系統(運用機器學習,純粹依據使用者行為推算人們偏好的內容)。相較於主動訂閱,推薦是更新、更成熟的模式。因為推薦不必明白表達意向或採取特定行動(例如在搜尋欄打字、訂閱、加好友或按「讚」)。

好的推薦需要達到高度的技術條件,完全依據使用者以前的行為來判斷偏好。AI領域近年快速進步,代表透過推薦來傳遞內容的做法將快速成熟。字節跳動這樣的公司受惠於技術進展,演算法推薦的效能與準確度因此突飛猛進。

追蹤行為,看穿你的偏好

字節跳動曾於2018年1月在北京舉行開放會議,揭露字節跳動推薦系統的原則。主要參考3種資料:內容概況、使用者概況和環境概況。

資深演算法工程師曹歡歡舉一個例子說明內容概況,關於利物浦與曼聯的英格蘭超級足球聯賽新聞報導,系統會運用自然語言處理(natural language processing)從文章擷取關鍵字,在這個例子包括「利物浦足球俱樂部」、「曼聯足球俱樂部」、「英格蘭足球超級聯賽」,還有球賽中一些重要球員的名字如「大衛.德赫亞」(David de Gea)。

接著賦予關鍵字相關值。依上述例子,「曼聯足球俱樂部」是0.9835,「大衛.德赫亞」是0.9973,兩者一如預期都很高。內容概況還包括文章發表時間,可幫助系統計算內容是否過時而停止推薦。

使用者概況則是依據不同來源建立,包括瀏覽紀錄、搜尋紀錄、使用的裝置類型、裝置的位置、使用者年齡、性別、行為特質等。他們會依據使用者社交資料和行為探勘,建立不同的概況,可細分成幾萬種。

當你閱讀平台推薦的貼文時,它會追蹤你的行為來了解你的偏好:好比你選擇讀什麼文章、哪些會略過不看、花在每一種內容的時間、會對哪類文章評論、分享什麼故事。

最後一項環境概況是依據使用者消費內容地點建立的,例如是在工作時、家裡或地鐵通勤時,因為人在不同的情況會有不同偏好。其他環境特質包括天氣,甚至是使用者網路連線的穩定度,以及使用何種網路(如Wi-Fi或中國移動4G)。

系統會計算內容概況、使用者概況、環境概況之間在統計上最匹配的結果,讓最多比例的文章被閱讀,優化讀完的比率(如花費的時間)。

內容傳遞的方式會依據每一篇新發表文章的品質和潛在的讀者賦予「推薦值」,這個值越高,文章便會傳遞給越多適合的讀者。

依據互動值,打造良性循環

隨著使用者與文章產生互動,推薦值會跟著改變。正面互動如按讚、評論、分享都會提高推薦值;負面行為如不喜歡、閱讀時間短則會降低推薦值。隨著內容越來越過時,推薦值也會降低。新聞週期快速的類別如運動或股價,推薦值一、兩天就會顯著降低。若是長青型的類別如生活格調或烹飪,過程會比較緩慢。

推薦給新使用者的前100篇文章非常重要,因為過了這個里程碑之後,保留率便顯著下降。他們的做法是找出「北極星」計畫的這個關鍵成長指標並加以量化,很類似臉書成長團隊早期的一個著名做法──致力讓新的使用者在10天內增加7個朋友。

根據前高階主管查馬斯.帕利哈皮提亞(Chamath Palihapitiya)的說法,臉書早期的團隊一天到晚「只談這個成長指標。」

字節跳動的這個目標促成保留率維持45%以上的高檔,一般多半只有主流社交媒體才能做到,在全世界這也是每個使用者花在App平均時間最長的成績之一。

頭條推薦文章的這套核心系統,後來加以調整後運用到TikTok和抖音的短影音。這些App都是使用字節跳動同一套後端推薦引擎系統。但用在影片的難度較高,因為上傳時,通常沒有標記關鍵字或準確的片名和敘述,使得電腦視覺(computer vision)要判定影片到底是什麼內容時面臨很大的挑戰。

滑App越久,推薦越精準

仰賴推薦來改善使用者互動的好處,是可以創造與時俱進的良性循環,通常稱為「資料網路效應」(data network effect)。人們花越多時間使用App,使用者概況越豐富,內容越精準符合需要,也就更能優化使用者經驗。這自然又會促成使用者花更多時間在App上,進一步豐富使用者概況,如此循環下去。

這個良性循環很強大,但不會無止境延續下去。使用者經驗的改善速度剛開始很快,但一段時間後會趨近極限(asymptote),因為使用者概況會越來越豐富,到最後形成非常精準又詳細的興趣圖譜(interest graph)。

字節跳動創辦人張一鳴曾在受訪時表示:「我們每個人在(App)後台都有一個興趣圖譜,普通用戶是看不到的。比如我感興趣的明星、我最關心的10家公司等等。」

字節跳動AI實驗室主管曾表示:字節跳動的「強大武器」是內容推薦引擎,以及既有的數百萬使用者概況和興趣圖譜資料庫。

字節跳動最重要的內容App共享同樣的後端技術堆疊和使用者概況。好比一篇文章在字節跳動的一款App被閱讀、被按讚,便會直接影響另一款App的內容推薦。

抖音的短影音很符合字節跳動的技術護城河。使用者通常每分鐘會點擊或滑動螢幕很多次,每次互動都多透露一點使用者偏好,使其興趣圖譜變得更豐富一些。反之,長影片提供的資料少很多,因為人們可以觀看一集45分鐘的劇,一次都沒有碰觸螢幕。

這套系統的一項局限是必要的人力投入。字節跳動號稱是純技術導向的公司,免除真人編輯。但這個說法有些誤導,這套系統仍重度仰賴人力,由一群員工進行重複的基本工作,如透過標記文章和人力審查來輔助機器學習。準確擷取關鍵詞對於精準推薦很重要,但像自然語言處理這類技術也只能做到某個程度。

☛ 《抖音 》立即購書:商周store博客來

書名:抖音

作者:馬修.布倫南
出版社:商業周刊
出版日期:2021年7月22日

馬修.布倫南 簡介
作家與國際肯定的演說家,鑽研中國手機網路科技與創新。見解見諸各大媒體,包括彭博、《華爾街日報》、《經濟學人》、《金融時報》、《富比世》、BBC等。多年來,他的「中國頻道公司」(China Channel)多次在中國舉辦國際品牌的大型年度微信數位行銷會議。