撰文/李信馬
1850年,哲學家路德維?!べM爾巴哈(Ludwig Feuerbach)在論文《自然科學與革命》中以德語寫下:“Der Mensch ist, was er i?t.”
這句話后來以英文版的“You Are What You Eat”(你吃什么,就是什么)傳播到了全世界,既可以指飲食和健康,也可以指人的精神,由其經(jīng)歷所塑造。
美國行為主義心理學創(chuàng)始人約翰?B?華生(John B.Watson)在1924年出版的《行為主義》(Behaviorism)中也曾提出:“給我一打健康的嬰兒,讓他們在我設定的環(huán)境中成長,我能保證隨機挑選一個,將其訓練成我選定的任何類型的專家——醫(yī)生、律師、藝術家、商人,甚至乞丐和小偷,無論其天賦、傾向、能力、職業(yè)和祖先種族如何?!?/p>
環(huán)境也許無法徹底決定一個人的命運,但足以深深影響人的三觀。互聯(lián)網(wǎng)的出現(xiàn),讓信息大爆炸,人類通過門戶網(wǎng)站、搜索引擎、公眾號微博等方式去了解世界,也被互聯(lián)網(wǎng)上或真或假的消息印象。
進入移動互聯(lián)網(wǎng)時代,短視頻平臺成為新的流量之王,據(jù)QuestMobile數(shù)據(jù)顯示,2024年12月,國內(nèi)用戶的月人均使用手機時長已經(jīng)提升至171.7小時,相當于每天超過5.5小時,其中用于短視頻的達到了62.9小時。
圖源:QuestMobile
短視頻讓人欲罷不能,也因此有人擔心,平臺的算法是否編織了“信息繭房”,讓人們只能看到自己感興趣的同質(zhì)化內(nèi)容,逐漸變得閉塞甚至偏激?
出于這樣的擔憂和質(zhì)疑,算法被視為巫術,背后的平臺如抖音、快手也經(jīng)常成為眾矢之的。4月15日,抖音在北京舉辦了“安全與信任中心開放日”活動,由相關業(yè)務負責人就抖音算法原理、平臺治理體系以及社會關切的問題,向包括DoNews在內(nèi)的廣大媒體展開了詳細介紹和澄清。
短視頻平臺到底有沒有為用戶編織一個個的“信息繭房”?看完這篇文章,或者讀者就會有一個答案。
一、推薦算法:主觀無意愿
“信息繭房”(Information Cocoons),是由美國學者凱斯?桑斯坦(Cass R. Sunstein)在2006年出版的著作《信息烏托邦 —— 眾人如何生產(chǎn)知識》中提出的。它是指在信息傳播中,公眾只注意自己選擇的東西和使自己愉悅的內(nèi)容,如同置身于一個由自己的興趣和偏見編織而成的蠶繭之中,從而將自己的生活桎梏于像蠶繭一般的 “繭房” 中。
抖音推薦算法的原理是什么?
首先,我們要知道,每天投稿到抖音的內(nèi)容有上億,而一名抖音用戶,差不多一天只會刷幾百個內(nèi)容。所以,推薦算法解決的如何從海量的內(nèi)容中,挑選出用戶喜歡的內(nèi)容并分發(fā)給他。
但這個過程中,算法并不需要了解內(nèi)容,它的重點是學習用戶的行為。
抖音的推薦算法的包括“召回” 和 “排序” 兩個核心環(huán)節(jié),當用戶點贊了一些美食的視頻,算法就會從上億量級的投稿內(nèi)容中,通過召回策略,將適合推送給用戶的內(nèi)容縮減至萬的量級乃至千的量級。
在篩選出用戶可能感興趣的幾百到幾千個內(nèi)容后,抖音會通過排序算法,基于用戶的短期行為(點贊、完播率等)與長期價值(收藏、與作者的持續(xù)互動、負反饋等),猜測用戶會對哪些內(nèi)容更感興趣,然后依次打分,再按分數(shù)由高到低進行推送。
具體的算法有協(xié)同過濾算法,核心邏輯就是尋找興趣相似的用戶群體,比如系統(tǒng)發(fā)現(xiàn)你和另一個陌生人點贊的內(nèi)容有重合,那么某個你看并點贊的內(nèi)容,他可能也喜歡,反之亦然。
隨著機器學習發(fā)展,神經(jīng)網(wǎng)絡技術被引入推薦系統(tǒng)。其核心步驟是將用戶與內(nèi)容的特征轉(zhuǎn)化為數(shù)值化向量,通過多層網(wǎng)絡結(jié)構進行復雜信號融合,從而更精準地匹配用戶需求。基于神經(jīng)網(wǎng)絡衍生出了雙塔召回模型,將用戶特征與內(nèi)容特征分別輸入兩個神經(jīng)網(wǎng)絡,通過頂層計算二者相似度,來判斷用戶對內(nèi)容的潛在興趣。
還有Wide&Deep ,“Wide”層處理淺層次的歷史行為數(shù)據(jù)(如用戶曾點贊的內(nèi)容),“Deep” 層通過深層網(wǎng)絡挖掘潛在關聯(lián)(如喜歡健身的用戶可能也對爬山、游泳感興趣),相比傳統(tǒng)協(xié)同過濾,能更全面地捕捉用戶興趣。
下面這張圖介紹了排序算法的基本原理。
圖源:抖音
從技術的視角來看,推送給用戶的內(nèi)容如果太發(fā)散,許多是用戶不喜歡的,那用戶的體驗就會變差;但技術的出發(fā)點,也不是為了讓用戶只看到自己喜歡的內(nèi)容。
抖音算法工程師劉暢表示:“用戶長期價值,是抖音推薦算法的‘北極星指標’,也就是我們最核心的業(yè)務目標?!?/p>
這一指標更接地氣的說法,是抖音希望有更多人使用抖音,并長期留下來。編織“信息繭房”可能短期讓人停不下來,但長期來看不一定是好事,打個比方,如果你知道一個用戶喜歡貓,就不停的給他推送貓相關的內(nèi)容,那他一段時間后就會厭倦離開。還有的用戶感性上喜歡看推送的內(nèi)容,但理性上討厭“奶頭樂”,甚至會特意不點贊來擾亂推薦。
圖源:抖音
所以,抖音反而有動力在推送用戶感興趣的內(nèi)容時,也通過算法推送多元化的內(nèi)容,比如一方面,對用戶感興趣的內(nèi)容,通過多樣性打散、多興趣召回、扶持小眾(長尾)興趣等方法控制相似內(nèi)容出現(xiàn)的頻次,另一方面,采用隨機推薦、基于用戶社交關系拓展興趣、搜索推薦聯(lián)動、“不感興趣”不再展現(xiàn)等方式,讓用戶探索更多的內(nèi)容。
圖源:抖音
劉暢在采訪中也表示,抖音的算法在向“長期價值”轉(zhuǎn)移:“我們一開始比較容易建模是偏短期性的,長期性的反而不好建模,對于一個短期的互動,它的隨機性比較弱,但對長期興趣它的隨機性更強。這個時候我們的技術角度逐步攻克,進一步去做流量上調(diào)控?!?/p>
只是,客觀來說,愛看自己喜歡的、認同的內(nèi)容,是人性使然,如果2006年“信息繭房”這個現(xiàn)象就被提出,那么今天短視頻平臺的用戶產(chǎn)生類似擔憂也是不奇怪了。
二、平臺治理:客觀有困難
我們畏懼“信息繭房”,更多的是害怕被淹沒在同質(zhì)化甚至有偏見的信息中,最終潛移默化的被影響和改變。反過來說,如果我們接觸的都是優(yōu)質(zhì)和健康的內(nèi)容,即使是陷入了“信息繭房”中,似乎也不必太擔憂。
但前面有說到,抖音的推薦算法是基于用戶的行為,而非對內(nèi)容的深度了解,那么,存不存在有害的內(nèi)容在抖音上不斷傳播的可能呢?事實上,這個可能性是存在的。
客觀上,這些情況的出現(xiàn)絕對不是抖音所希望看到的,只是治理上也有困難。目前,抖音的平臺治理鏈路核心有兩個原則。首先是所有在發(fā)布的內(nèi)容都會經(jīng)過評估,流量越高的內(nèi)容經(jīng)過評估的次數(shù)越多,標準也越嚴格。其次是“人工+機器”審核相互分工又密切配合。
具體來說,內(nèi)容上傳至抖音后,首先進入機器識別環(huán)節(jié),如果內(nèi)容被識別出含有高危特征,將被直接攔截。如果未命中高危特征但模型判斷有問題,則會送至人工審核;若問題概率較低,則獲得基礎流量進入下一環(huán)節(jié)。視頻被舉報、評論區(qū)出現(xiàn)集中質(zhì)疑、流量激增等情況出現(xiàn),均可能觸發(fā)“人工+機器”審核。一旦內(nèi)容在任一環(huán)節(jié)被處置,系統(tǒng)會立即停止進一步推薦和分發(fā)。
下圖可以看到,一個短視頻要在抖音順利分發(fā),要經(jīng)過機器和人工的四次審核。就像談毒藥都要談劑量,這樣也盡可能將不良信息的危害控制住。
圖源:抖音
實際上,平臺治理是今年抖音重點任務。抖音生態(tài)運營經(jīng)理陳丹丹在采訪中表示,他們有陸續(xù)收到用戶、媒體,還有主管部門的反饋,去年年底也經(jīng)過了多輪的討論:“我們確實把平臺治理和算法透明度作為貫穿全年的重點。我們想要達到的一個目標是信任,因為獲得用戶信任、媒體信任、社會信任是很難的課題。在這個過程當中,需要我們不斷地把治理體系、推薦算法技術做公開,更多是平臺選擇了這樣的動作?!?/p>
短視頻已經(jīng)成為國人精神生活的重要組成部分,甚至可以說是當代互聯(lián)網(wǎng)文化的重要載體,而非只是賺錢的娛樂,忽視這些,技術這把雙刃劍也有可能造成破壞。除了商業(yè)價值之外,抖音也應在社區(qū)價值方面承擔更多的責任。