本書作者Matthew Brennan專研中國網路科技與創新,文章見諸全球各大媒體,包括彭博、華爾街日報、經濟學人、BBC等。Brennan創立的公司中國頻道(China Channel)多次在中國舉辦中國最大的年度微信數字營銷會議,Matthew並與中國最大的英語科技媒體Technode共同主持了Podcast節目ChinaTechTalk。Brennan長居中國(成都),說得一口流利中文。
這本書從崛起歷程、技術優勢來介紹抖音,相信是研究字節跳動,或是科技公司發展的讀者不可或缺的一好書。底下這個連結是Brennan所寫的中國快時尚公司SheIn的文章:https://www.china-speakers-bureau.com/2021/05/26/what-shein-has-been-doing-right-matthew-brennan/
1.中國各地有數百處點擊農場(Click farm),業者必須避開機器人流量偵測系統。儘管要花費硬體成本和電費,實體裝置還是可靠得多(虛擬模仿軟體很容易被偵測出來)。只要透過USB線控制便宜的Android手機,就可以利用軟體,模擬真人的點擊和滑動。例如50美金可以買到抖音的1萬個讚、10萬次觀看、5,000次分享、50則評論。要成功騙過系統,得先了解這些app的演算法如何運作。
2.TikTok的演算法
(1)一支影片上傳到TikTok,系統就利用電腦視覺(computer vision)分析與辨識影片裡的元素,進行內容與敘述的自動化審核,並以關鍵字加以標註和歸類。影片若被懷疑違反平台內容的規定,就會標記由人力審查。
(2)篩選完後,影片會發布給數百位活躍使用者(active user),接著分析觀看完成數(complete view)、按讚數、評論、平均播放長度、分享數等指標,以評估影片在其垂直類別中的人氣。表現好的繼續往上晉升一級:再發布給數千名活躍使用者觀看,同樣評估更多指標。表現最佳的影片再往上晉級:曝光給更廣大的觀眾,隨著影片層層晉級,就有機會讓數百萬使用者看到。
(3)上述這個(2)的過程不是光由演算法運行,進入較高層級後,會由內容審查團隊真人觀看,並依循一套嚴格的規範判斷,以確定沒有違反平台的條款,或牽涉任何智財權的問題。
確實有可能鑽到漏洞,運用點擊農場的服務,以人為手段大幅提升影片晉級的機會,而平台就會採取更嚴格的偵測方法,這就演變成一場永無止境的貓捉老鼠的遊戲。點擊農場的目的,就是要騙過TikTok的推薦系統,而推薦就是運用機器學習,依據使用者的行為推算出人們偏好的內容,這是TikTok的核心技術,也是要了解TikTok(與字節跳動)為何成功的關鍵。
3.張一鳴(1983-)說他很早就開始閱讀,後來還回想說對於小時候沒有太多選擇感到挫折,他說如果小時候有Kindle、iPad、維基百科、YouTube可看,他一定比現在聰明得多。進入南開大學,張一鳴一從電機工程轉念軟體工程,課餘時間不是寫程式、閱讀,就是修電腦。
張一鳴好友形容他的人生觀就是追求卓越,而且他不那麼重視穩定,反而很有興趣冒險投入具發展潛力的新領域,而且很少表現出對物質或個人財富有多大的興趣。2006年張一鳴加入旅遊(機票與飯店)搜尋引擎酷訊,2008年離開酷訊進入北京微軟亞洲研究院,但張一鳴覺得微軟規則太多、步調太慢,是事業最無聊的一年。
張一鳴在酷訓期間認識了後來美團的創辦人王興(1979-),王興因看到臉書的成功而放棄了在德拉瓦大學博士課程,回中國創業。王興說服張一鳴加入他新創的山寨版推特:飯否,但2009年爆發「烏魯木齊75事件」,北京展開網路鎮壓,包括推特、飯否和臉書都被封鎖,1年半後飯否獲准重開,但新浪微博已席捲市場贏得中國推特的美名。王興接著於2010年創辦了美團。
飯否關閉後,創投業者海納國際(SIG)中國海納常董王瓊(曾投資酷訊)說服張一鳴加入海納於2009年投資支持的新事業:九九房網,類似美國線上房地產資訊網Zillow(Nasdaq:ZG)。於是張一鳴成為九九房網的執行長,成員包括他在南開大學同宿舍的梁汝波(1983-)。後來因智慧型手機興起,九九房網推出5款手機app,瞄準房地產市場不同族群,其中一款app「房產資訊」將主要新聞入口平台和人氣房產網站的文章集中起來,可以說是後來今日頭條的前身。
4.2011年張一鳴觀察到年初搭北京地鐵時,通勤族仍在看報紙,不過幾個月後就都在看手機了。他斷定智慧型手機會取代報紙,成為最重要的信息傳播媒介。他不想將自己局限在房地產市場,因此從九九房產離職。他找了王瓊談他的創業計畫,海納國際決定投資天使資金8萬美金(加上後續投資,使海納目前持有字節跳動15%股權)。
張一鳴團隊取名先取英文名,想出ByteDance,據說靈感來自賈伯斯的人文藝術觀,賈伯斯在2011年iPad2的發表會上說:「蘋果DNA裡只有科技是不夠的,而是科技和博雅素養(liberal arts)、科技和人文的媒合,才讓我們獲得內心歡唱的結果」。張一鳴團隊接著才據此想出中文名:字節跳動。
5.成立之後字節跳動推出了幾款app(例如搞笑囧圖、內涵段子等),但張一鳴觀察相較於電腦,使用智慧型手機有三大痛點:螢幕小、時間碎片化、資訊超載,但中國還沒有一樣產品能同時處理這三個痛點。他說就像Facebook將人與人連接起來,Uber將人與車連接起來,他的產品要將人與信息連接起來,「今日頭條」於是誕生。
在今日頭條前,中國多數新聞入口網站還是採用真人編輯、篩選內容,張一鳴相信隨著科技進步,新聞篩選過程將完全除去真人,改採大數據和機器學習的自動化系統。以尋人啟事為例,通常是隔天放在報紙的夾頁當中,時間效果都差,今日頭條試著以個性化分即時發(走失的附近),發現找到人的效果好很多。
6.字節跳動在今日頭條推出後仍未開始賺錢,需要第二輪融資(天使輪與第一輪都是SIG投資),但中國創投界都拒絕投資,包括紅杉資本的沈南鵬。一方面張一鳴太娃娃臉,另方面今日頭條被看做是另一個手機版的新聞入口網,這是個成熟的紅海市場。結果資金來自俄羅斯投資人、物理學家Yuri Milner(1961-),Milner創立的數位天空投資DST投資公司,投資了臉書、推特、Spotify、京東、小米、阿里巴巴,以及後來的字節跳動。
當時華裔企業家黃共宇(Matt Huang,後來加密貨幣平台Paradigm聯合創始人之一,Stripe董事),離開在Y Combinator受訓後,新創事業被推特收購,到中國尋找投資機會,王瓊介紹張一鳴給黃共宇認識,後來不但黃家自己有投資字節跳動,黃共宇還想起當時在Y Combinator給43家新創公司都各投15萬美金的Milner。Milner的DST投資公司指派合夥人周受資(1983-)研究字節跳動,最後Milner領投第二輪,取得字節跳動7.2%股權。
上述黃共宇的爸爸也很有名,是LTCM的合夥人之一,他們父子的故事詳見「他24歲從矽谷來北京旅遊,認識了張一鳴,投資頭條現在賺了2000倍」:https://zhuanlan.zhihu.com/p/65477566。而那時負責DD字節跳動的周受資,於來接受雷軍的邀請出任小米的財務長,並於2021年加入字節跳動擔任財務長兼TikTok的執行長,後來專心擔任TikTok的執行長。
7.YouTube 2010年的困境:YouTube試驗透過各種策略以改善網站的保留率(retention),讓人們看更多影片、也看更久。它們甚至大手筆花了1億美金和內容創作者簽約(包括瑪丹娜、俠客歐尼爾),反映出YouTube的目標,就是把YouTube變成像電視一樣的娛樂終點站。但問題是花更多錢買更好的內容不是對的策略,因為對每個人來說,YouTube都有100小時的內容是想要觀看的,內容已經在那裡了。問題是如何讓大量的內容與使用者匹配,訂閱頻道確保人們看到喜歡的內容,但效果還是不夠好。YouTube的結論是,當人們知道自己要看什麼時,會來YouTube找;但當人們不知道自己要看什麼時,我們也要能滿足他們的需求。
2011年Google開始採用新的學習機器系統(Sibyl)來推薦YouTube影片,立刻發揮影響。Google繼續迭代改進和優化推薦系統,之後從Sibyl換成Google Brain(領導人吳恩達是Coursera的共同創辦人之一,2011年創建Google Brain,2014年加入百度,2017年成立人工智慧公司Landing.ai)。AI領域快速進步(其中深度學習(Deep learning,機器學習的分支)的突破性發展是其中一項),對字節跳動這樣的公司,時機再適合不過,它們正處於演算法推薦新時代的初期階段,YouTube是最早受益的。字節跳動不只一開始抓住商機,也抓住了兩項劃時代的趨勢:智慧手機與AI的興起。
事實上張一鳴2000年代末期對推薦的威力就有最早的領悟。當時中國新年即將來臨,大都市的千萬移工得上網搜尋返家的火車票,但買票過程非常吃力,不是得不斷更新旅遊網站,檢查有沒有票、就是花大錢買黃牛票。張一鳴則是自己設計了一個程式,可以自動檢索售票網站,有票就通知他。他只花了一頓飯的時間寫程式,不到30分鐘就買到票了。
8.網路可以分成幾個時期,最早是入口網站、之後是搜尋、接著是微博、最後是推薦引擎。不同的方式接收與傳送資訊,可以看出技術扮演的角色。
(1)真人篩選:入口網站,類似報紙,同樣採取中央化的收集,由編輯人員更新和整理。例如美國的雅虎、美國線上,以及中國的網易、新浪、搜狐。
(2)搜尋引擎:到了1990年代,網路資訊爆炸,任何人都可以建立自己的部落格發表文章,無法再以人力分類排序。搜尋引擎可以運用技術幫助使用者找到資訊。例如最早的Alta Vista、雅虎與後來的霸主Google、百度。但搜尋引擎有個大缺點,就是必須知道要搜尋的詞:在搜尋欄打出隊的詞,然後從列出的搜尋結果找出最適合的選項。但是因為新聞和娛樂這兩種訊息的價值大部分來自「發現」,因此並不適合採用搜尋的方式。
(3)訂閱:email和RSS,有20多年「請訂閱我們的電子報」是各網站最重要的推廣方式,因此每個人的收件匣都塞滿了這類訊息。訂閱並沒有像搜尋一樣產生網路霸主,一是因為RSS和email採公開標準格式,不是任一家企業所能控制;另是因為訂閱很快就被另一種傳遞方式所取代:社交。
(4)社交:社交媒體所訂閱的等於是個人(分享訊息的朋友)。
(5)推薦:今日頭條與TikTok。一般而言推薦系統仰賴兩種流程:內容過濾(content-based filtering)和協同過濾(collaborative filtering)。
9.推薦入門(詳見https://cloud.tencent.com/developer/article/1052655):字節跳動的推薦系統主要考慮三種資料:內容、使用者、環境。例如利物浦和曼聯的英格蘭超級足球聯賽新聞報導,系統會運用自然語言處理(natural language processing)從文章擷取關鍵字,在這例子中是「利物浦足球俱樂部」、「曼聯足球俱樂部」、「英格蘭超級足球聯賽」,及一些重要球員的名字。接著賦予關鍵字相關值,「內容」還包括文章發表的時間,可以幫助系統計算內容是否過時而停止推薦。
「使用者」是依據不同來源建立,包括瀏覽紀錄、搜尋紀錄、使用的裝置、使用者的年齡、性別、行為特質等。會依據使用者的社交資料和行為探勘,建立不同的概況,可以細分成好幾萬種。當你閱讀平台推薦的貼文時,系統會追蹤你的行為來了解你的偏好:好比你選擇讀什麼文章、哪些會略過不看、花在每一種內容的時間、會對哪類文章評論、分享什麼故事。
「環境」則是依據使用者消費內容的地點建立的,例如是在工作時、家裡或地鐵通勤時,因為人在不同的情況會有不同的偏好。其他環境特質包括天氣,甚至是使用者網路連線(使用何種網路)的穩定度等。
系統會計算內容、使用者、環境之間在統計上最匹配的結果,讓最多比例的文章被閱讀。依據每一天新發表文章的品質和潛在的讀者賦予推薦值,這個值越高,文章便會傳遞給越多適合的讀者。隨著使用者與文章產生互動,推薦值會跟著改變。正面互動如按讚、評論、分享都會提高推薦值,負面行為如不喜歡、閱讀時間短則會降低推薦值。隨著內容越來越過時,推薦值也會降低,新聞周期快速的類別如運動或股價,推薦值一兩天就會顯著降低;若是長青型的類別如生活或烹飪,這個過程就會比較緩慢。
今日頭條推薦文章的這一套核心系統,用在影片的難度會較高,因為影片上傳時通常不會標記關鍵字或準確的片名和敘述,使得電腦視覺(computer vision)要判定影片到底是什麼內容時面臨很大的挑戰。
仰賴推薦來改善使用者互動的好處,是可以創造與時俱進的良性循環,通常稱為資料網路效應(data network effect):人們花越多時間使用app,使用者概況會越豐富,內容越精準符合需要,也就更能優化使用者經驗。這自然又會促成使用者花更多時間在app上,又進一步豐富使用者概況,如此循環下去。但這個循環不會無止境的延續下去,使用者經驗的改善速度剛開始很快,但一段時間後會趨近極限,因為使用者概況會越來越豐富,到最後形成非常精確又詳細的興趣圖譜(interest graph)。
10.今日頭條這套系統的一個侷限是仍需必要的人力投入(例如人力審查來輔助機器學習),另個場景是使用成長駭客(growth hacking)來進行行銷。字節跳動與手機經銷商達成協議,在手機離開工廠但到達消費者手中前,可以預載app。字節跳動用人為方式,例如在深圳機場的倉庫,將一支支手機拿出來,批次預載安裝10幾款app,然後完全按照原來的樣子放回盒子、封上膠帶。字節跳動發展初期,透過預載獲得數千萬使用者。
11.今日頭條下階段發展則是獲利:廣告,張一鳴找來了張利東(1979-,現任字節跳動董事長)。今日頭條廣告收入年年暴增,讓字節跳動與BAT:百度、阿里巴巴、騰訊可以平起平坐。一個新的詞彙開始出現,TMD:頭條、美團、滴滴。
12.第一個短影片app Vine由4名美國年輕工程師於2012年創立,允許用戶創建最長6秒的短片並分享到到其他社交網路如Twitter或臉書。推出後一炮而紅,Twitter創辦人Jack Dorsey看到潛力立刻將其收購。但不到4年時間,Twitter宣布關閉Vine。接著巴黎一個團隊2013年創立Mindie,改進短影片選項,它們以直立全螢幕顯示(相較於Vine與後來加入短影片的IG,影片都是方框顯示,未能善用iPhone的螢幕比例),並以API取得iTunes所有販售音樂的30秒試聽片段。為影片配上音樂,就像IG當初使用濾鏡美化照片一樣,有很好的效果。
Mindie的山寨版Musical.ly由朱駿和陽陸育於2014年創立,並以多種語言在全球推出app,結果在美國很成功,但在中國卻失敗了。原因是美國是音樂王國,且app初期使用者多是青少年,放學後有很多時間休閒娛樂;而在中國的青少年通常放學後還要補習準備考試。Musical.ly美國後來靠著對嘴戰(Lip Sync Battle)使得下載數飆高。YouTube做為知識與娛樂資料庫表現絕佳,但其社交連結就比較弱,Musical.ly的夢想是成為影片版的IG,他們一心想要將Musical.ly營造成社交平台,類似當時中國短影片龍頭快手。
但後來Musical.ly發現它們錯了,它們不是社交平台,而是內容平台。而且使用者集中在年輕人,等創作者年紀漸長,他們可能轉移到YouTube或IG上。而且Musical.ly自認技術不夠先進,有好的推薦技術才能讓長尾內容創作者累積粉絲,強化內容的多樣性也才能使平台吸引年輕人以外的族群。
13.字節跳動進入影片領域較晚,決定三管齊下模仿已經奏效的做法:(1)「西瓜影音」模仿YouTube;「火山小視頻」模仿快手;「A.me」(後來的抖音)模仿Musical.ly。字節跳動不想成立長影片平台,類似網飛或Hulu,因為激烈在中國已經很激烈,由BAT支持的三大平台愛奇藝、優酷、騰訊視頻燒錢搶市佔。更重要的是,長影片平台的成功靠的是高預算取得內容,無法發揮字節跳動在演算推薦的優勢,而短影片所需技術就是公司的護城河。
A.me剛開始表現不佳,它們首先決定改名,最後選出抖音,更選定具故障效果(glitch effect,讓人想到舊電視訊號太弱的靜電干擾雜訊,但完美傳達擺動的感覺)、音符符號修改成包含子母d的標誌。而解決內容問題,抖音則深入中國藝術學校,尋找上鏡頭的學生使用抖音。到了2017年抖音開始大爆發,並且字節跳動大撒幣,大打廣告宣傳,並且直接送給使用者紅包。
14.為何抖音成功了,Musicaly.ly卻沒有?畢竟抖音是模仿Musicaly.ly的15秒、全螢幕短影音。
(1)基礎建設:抖音比Musical.ly晚3年推出,但環境卻讓抖音有更有利的成功條件,例如4G網路已在中國普及;智慧型手機解析度更高;臉部辨識和電腦視覺的進步使人可以做出更好的特效與濾鏡效果,也大幅降低人力審核的程度。
(2)母公司的支援:抖音與字節跳動的關係,就像IG與臉書、微信與騰訊的關係一樣,初期沒有獲利的壓力,也沒有資金取得的壓力。而且抖音原是字節跳動三管齊下的一個方案,而三個方案都可以利用公司現有的技術堆疊(technology stack)和大數據,其中最關鍵的是推薦引擎和現有使用者興趣圖譜。此外字節跳動的「app工廠」模式也使很重要的關鍵。
(3)定位:Musical.ly誤信它們主要是社交平台;而抖音就是內容平台,且運用其推薦技術精心將平台擴及中尾與長尾市場:旅遊、美食、時尚、運動、遊戲、寵物等,將平台定義為記錄美好的生活。
15.在全球佈局方面,字節跳動先是在2017年以5,000萬美金併購了Flipagram,這款app可以將手機中的照片集中,變成搭配音樂的幻燈片播放。接著創造抖音的國際版本TikTok。
遭遇瓶頸的Musical.ly在2017年底決定出售,它在西方市場仍建立起一定品牌知名度,包括字節跳動、臉書、騰訊、Snapchat和快手都表達興趣、甚至和創辦人談過。最後張一鳴談成併購案(併購案的一項難度是,Musical.ly的天使投資人、獵豹移動的傅盛要求將其「新聞共和國」一併出售、並投資其直播平台),最後的協議是3筆交易一起打包,分別是字節跳動以8,600萬美金買下獵豹移動的新聞聚合平台「新聞共和國」、以5,000萬美金投資獵豹移動的直播平台Live.me,最後是以8億美金併購Musical.ly。2018年TikTok和Musical.ly合併,TikTok第一次在美國上線。
16.張一鳴馬化騰互嗆:2018年第一季TikTok下載第1名
騰訊有時被稱為科技界的波克夏,在2014年錯失收購Whatsapp的機會,讓臉書捷足先登。而在短影片方面,騰訊早在2013年就推出模仿Vine的微視,但因只有基本功能,又欠缺內部的支持,到了2015年執行長離職,app也停止更新。接著騰訊宣布投資快手(根據快手2021年香港上市招股書,騰訊持有快手21.57%股權,為其最大股東),並正式關閉微視。但騰訊後來感到字節跳動的威脅,2018年微視復活,但抖音已經成為短影音的同義詞了。靠著TikTok字節跳動成功打進西方,而騰訊的微信海外使用者,還是海外中國人和與中國做生意的人。
字節跳動又在為了TikTok的推廣在西方媒體大撒幣,接著靠納斯小子(Lil Nas X)的Old Town Road所帶動的牛仔熱等迷音,TikTok使競爭者難以超越。2020年臉書的Sheryl Sandberg公開表示TikTok讓它們感到憂心。
我自己更喜歡看的是shaffle dance:
17.平台金字塔模型(from Snapchat創辦人Evan Spiegal)
因此金字塔模型說明Snapchat認為TikTok不是威脅,兩者核心價值不同:TikTok提供的是來自陌生人的娛樂內容;而Snapchat則是讓朋友互相連結。TikTok可以視為智慧型手機時代真正的電視繼承者,簡單的上滑動作就好比遙控器轉台一樣,又因為不知道接下來會看到什麼(但有推薦功能在,不會是不想看到的),更能引發讓人上癮的期待心理。
13.TikTok的雙飛輪正向循環
14.川普以威脅國家安全為由,於2020年以行政命令宣布封殺TikTok,並要求其於90天內出售其美國業務。微軟和甲骨文等競爭,原本傳出甲骨文與威名百貨將入股分拆TikTok美國業務的新公司,後因TikTok提交了禁令請求而喊停,而在拜登上任後,於2021年撤銷川普對TikTok的行政命令。