【摘要】智能推送過程中的推薦算法有一個認(rèn)識誤區(qū),就是把“熱度”指標(biāo)所體現(xiàn)的公眾對一個信息的趣味性的認(rèn)可,視為公眾認(rèn)為該信息重要。這實際上是把重要性和趣味性混為一談,把趣味性當(dāng)成了第一重要的東西,導(dǎo)致其推薦內(nèi)容過度娛樂化并流向低俗化。
【關(guān)鍵詞】智能推送 算法 趣味性 【中圖分類號】G20 【文獻標(biāo)識碼】A
信息技術(shù)進步帶來傳播效率的提升和個人選擇權(quán)的擴大
如果我們?nèi)婵疾烊祟悅鞑セ顒拥臍v史,就會發(fā)現(xiàn),這個歷史是社會成員個人的信息權(quán)不斷擴張的過程。在大眾傳播理論里有一個“選擇性接觸理論”,認(rèn)為受眾往往并不是不加區(qū)別地對待任何媒介和內(nèi)容,而是更傾向于接觸與自己的既有立場、觀點、態(tài)度一致或接近的媒介或內(nèi)容。在大眾傳播時代,人們看報紙、看電視實際上都是有選擇的。
進入網(wǎng)絡(luò)傳播時代,信息技術(shù)進步的結(jié)果,是媒體個人化以及以此為基礎(chǔ)的信息個人化的進一步加強。無論是搜索引擎,還是推薦引擎,基本原理都是把滿足個人的信息需求放在首位,整體上在強化個人對信息的選擇權(quán)。事實上,網(wǎng)絡(luò)信息需要點擊打開的呈現(xiàn)方式,本身就賦予了網(wǎng)絡(luò)用戶信息選擇的決定權(quán)。而基于算法的精準(zhǔn)推送技術(shù),更是大大提升了傳播的效率。
美國學(xué)者施拉姆在《傳播學(xué)概論》中為了解釋個人如何選擇信息傳播路徑,列出了下列公式:
在理想化的智能推送過程中,一方面是將公式中“可能的報償”做到了最大值,因為智能推送的默認(rèn)邏輯就是向用戶推送他最關(guān)心、最感興趣的信息;另一方面,也將用戶獲取信息的“費力的程度”降到了最小值。因為目前智能推送基本都是基于移動互聯(lián)網(wǎng)傳播體系,這種新型傳播體系與大眾傳播體系相比,能夠讓用戶以最短的時間、最少的金錢和最小的精力來獲取到這些信息。從這個角度看,智能化的精準(zhǔn)推送基本上就是信息選擇“或然率公式”的最優(yōu)解,它兼?zhèn)淞俗畲蟮姆肿又岛妥钚〉姆帜钢?,因此具備最大?ldquo;選擇或然率”,即用戶對于具備精準(zhǔn)推送能力的媒體選擇概率最高。
如果我們從網(wǎng)絡(luò)傳播技術(shù)對社會成員表達權(quán)的影響角度觀察,將會發(fā)現(xiàn),互聯(lián)網(wǎng)的普遍賦權(quán)特性,使得普通社會成員的表達權(quán)得到了更多實現(xiàn)的條件,獲得了更多“積極的自由”。這也是“自媒體”產(chǎn)生和發(fā)展的技術(shù)基礎(chǔ)。
通過上述考察我們會發(fā)現(xiàn),社會成員個人對信息的選擇權(quán)和表達權(quán),隨著信息技術(shù)的發(fā)展而得到增強,是歷史發(fā)展的趨勢,體現(xiàn)著社會的進步,是社會成員個人應(yīng)該得到尊重的基本權(quán)利。在這個意義上,盡管美國學(xué)者凱斯·桑斯坦提出“信息繭房”說,對于“公眾只注意自己選擇的東西和使自己愉悅的通訊領(lǐng)域,久而久之,會將自身桎梏于像蠶繭一般的‘繭房’中”表示擔(dān)憂,但不能不說,整個社會傳播效率的提升以及社會成員個人的信息主權(quán)的強化,更具有進步意義。更何況“信息繭房”說提出的“繭房”效果,也就是由于信息不完全而導(dǎo)致的認(rèn)知偏差,在大眾傳播過程中,也會由于公眾的選擇性接觸以及媒體“把關(guān)人”的特定價值取向而產(chǎn)生。
智能推送技術(shù)會產(chǎn)生“內(nèi)容下降的螺旋”
當(dāng)前,智能推送技術(shù)應(yīng)用產(chǎn)生的最為人詬病的問題,是低俗和虛假內(nèi)容常常會被算法選取并加以推送。實踐中,幾乎所有采用這一技術(shù)的信息平臺都出現(xiàn)了這一問題。那么,出現(xiàn)這個問題的真正原因是什么?
在智能推送技術(shù)中,實際上包含著這樣幾個環(huán)節(jié):其一是選擇什么樣的規(guī)則處理信息;其二是把采用的規(guī)則做成數(shù)學(xué)模型,即把規(guī)則數(shù)學(xué)化,找到規(guī)則涉及的各要素之間的函數(shù)關(guān)系,確定算法;其三是導(dǎo)入大數(shù)據(jù)用于機器的深度學(xué)習(xí)和訓(xùn)練;其四是使用算法處理大數(shù)據(jù)。
結(jié)合這一算法的運用以及此類平臺運營規(guī)則,一些平臺之所以出現(xiàn)部分低俗、虛假內(nèi)容被推送的狀況,主要有如下原因:
其一,缺乏內(nèi)容監(jiān)控的意識和手段。在聚合各種自媒體內(nèi)容時,資訊平臺為最大規(guī)模地占有內(nèi)容資源,在其發(fā)展的特定階段,往往不加甄別地擴充自媒體的內(nèi)容,這樣就容易造成大量質(zhì)量不高的內(nèi)容充斥內(nèi)容數(shù)據(jù)庫,使得供給側(cè)內(nèi)容雜蕪,魚目混珠。平臺上這些大量低品質(zhì)內(nèi)容的供給,滿足并“創(chuàng)造”著對低俗內(nèi)容的需求。而資訊平臺以往對此大多缺乏必要的把關(guān)意識和技術(shù)手段,它們對低俗內(nèi)容的判斷,主要方式是對文本的情感分析,并結(jié)合用戶的負(fù)反饋信息,有些平臺甚至在主觀上還企圖借此提高“流量”和用戶數(shù)。
其二,算法的取值偏差。目前智能推薦算法主要取值點是熱度,即用戶對一條信息的點擊量,一位資深的算法架構(gòu)師說“內(nèi)容熱度信息在大的推薦系統(tǒng)特別在用戶冷啟動的時候非常有效”。這意味著推薦系統(tǒng)的初始設(shè)定,基本上都是根據(jù)用戶信息點擊的歷史數(shù)據(jù)判斷其信息偏好而產(chǎn)生的,點擊量高的內(nèi)容和內(nèi)容類別會作為初始設(shè)定,被推給更多用戶。而用戶使用移動終端的場景近乎個人獨處,具有私密化特征。在這樣的一個狀態(tài)下,人們所表現(xiàn)出來的信息需求,常常是獵奇心重,對低俗內(nèi)容較為敏感,這類低質(zhì)量信息往往點擊量較高。這就造成了在需求側(cè),平臺通過以往采用的取值方式所采集到的信息需求特征,主要是比較低俗和原始的需求。而如前所述,由于平臺上自媒體數(shù)量眾多,且管控手段和意識不強,導(dǎo)致供給側(cè)大量充斥著不良內(nèi)容,通過算法的匹配,以及運營指標(biāo)和運營機制的引導(dǎo),就產(chǎn)生了一個下降的螺旋,造成平臺上生成和推送的內(nèi)容越來越低俗。所以說,是當(dāng)前的算法取值失當(dāng)造成了“內(nèi)容下降的螺旋”。
就上述分析來看,智能推送過程中出現(xiàn)的內(nèi)容低俗問題不是算法本身導(dǎo)致的,而是平臺在內(nèi)容聚合過程中缺乏對內(nèi)容的有效甄別和控制,加之算法取值失當(dāng)造成的。這類推薦算法有一個共同的認(rèn)識誤區(qū),就是它們都把“熱度”指標(biāo)所體現(xiàn)的公眾對一個信息的趣味性的認(rèn)可,視為公眾認(rèn)為該信息重要,把公眾對一個信息的興趣,誤當(dāng)做是這個信息的重要性來進行推薦??陀^全面地分析“熱度”,我們發(fā)現(xiàn),這個指標(biāo)更多地反映了用戶對于特定信息感興趣的程度,可以映射新聞信息的“趣味性”,但無法反映特定信息對于用戶個人和社會的選擇和決策行為的真正價值,即新聞信息的“重要性”。目前智能推薦的取值法實際上是把重要性和趣味性混為一談,把趣味性當(dāng)成了第一重要的東西,導(dǎo)致其推薦內(nèi)容過度娛樂化并流向低俗化。
改進算法,完善甄別信息真?zhèn)魏蛢?yōu)劣的手段,運用現(xiàn)代科技正本清源
盡管基于海量信息聚合,并以算法驅(qū)動精準(zhǔn)分發(fā)的智能推送存在上述問題和局限,而且商業(yè)性質(zhì)的資訊平臺還容易受到逐利動機的影響,從而加劇這些問題,但不可否認(rèn)的是,算法技術(shù)推動了信息傳播方式的顯著進步。
在移動互聯(lián)網(wǎng)時代,移動新聞客戶端成為公眾接收新聞信息的主要渠道。移動終端的個人化特點及其便攜性促進了場景化的信息使用,而信息交互讓用戶成為傳播主體。如何實現(xiàn)海量信息資源與個性化信息需求的高效匹配,構(gòu)成了移動傳播的特殊矛盾。算法技術(shù)對傳播方式進步的貢獻在于,它能夠以較高的效率和較低的成本,在社會普遍信息化所產(chǎn)生的海量信息供給中,為個性化需求尋得精準(zhǔn)匹配結(jié)果。
那么如何優(yōu)化算法,避免“內(nèi)容下降的螺旋”呢?我們不能簡單地堆砌現(xiàn)在主流媒體所使用的編輯原則,而是應(yīng)當(dāng)以現(xiàn)有編輯原則為基礎(chǔ),同時結(jié)合移動互聯(lián)網(wǎng)時代信息分發(fā)的規(guī)律、公眾接受信息的規(guī)律,形成更加具有科學(xué)性的算法。這樣一來,我們就可以把對一個事件重要性的社會判斷、個人判斷有機結(jié)合,把個人選擇和社會選擇結(jié)合起來,讓個人能夠有機會獲得更多的既符合其自身利益,又體現(xiàn)社會主流價值的信息推送。從實踐看,今日頭條等平臺在近期的整改中調(diào)整了算法,使容易產(chǎn)生虛假和低俗內(nèi)容的領(lǐng)域的信息推薦量和閱讀量減少了40%。
要想恰當(dāng)解決在當(dāng)前算法應(yīng)用中出現(xiàn)的問題,不僅需要改進算法,還需要完善甄別信息真?zhèn)魏蛢?yōu)劣的手段,以正本清源。對信息真?zhèn)蔚蔫b別,國外的臉書(Facebook)和谷歌、國內(nèi)的微信和微博大多采用第三方核查的方式,然而,這些方式都屬于事后應(yīng)對,未能形成預(yù)警機制,難以提前防范虛假信息的發(fā)布和傳播。隨著各類傳播平臺的用戶規(guī)模不斷擴大,虛假信息一旦被廣泛傳播,信息源的資質(zhì)審查和事后懲罰都難以補償負(fù)面輿情效果。因此,傳播之前的攔截具有重要意義。當(dāng)前,互聯(lián)網(wǎng)信息傳播平臺努力的方向,都是借助人工智能技術(shù)手段進行事先核查。包括臉書、今日頭條在內(nèi)的一些平臺近期均大幅度增加了審核人員,正在嘗試以“人工+機器”的模式構(gòu)建防火墻,以對敏感詞、“標(biāo)題黨”和虛假信息進行攔截,它們也企圖借助人工智能技術(shù),模仿人腦機制,攔截低俗圖片、視頻等不良內(nèi)容。今日頭條等平臺還加強了對自媒體賬號及其發(fā)布內(nèi)容的管理,對低俗和虛假信息的產(chǎn)生有較為顯著的遏制作用。
還有一個問題值得我們思考,這就是,在我國的互聯(lián)網(wǎng)傳播過程中,是不是商業(yè)利益動機過于強烈?互聯(lián)網(wǎng)的公共空間應(yīng)該是公共交往、社會參與的場所,而過于強烈的商業(yè)動機會助長不擇手段地追逐經(jīng)濟利益,從而污染社會輿論環(huán)境?;ヂ?lián)網(wǎng)的公共平臺是用來服務(wù)公眾的,不是用來個人發(fā)財?shù)?,這才是公共平臺的價值所在。在這方面澄清觀念,也是正本清源之一種。
(作者為中國人民大學(xué)新聞學(xué)院教授、博導(dǎo))
【注:本文系國家社科基金重點項目“以媒介融合推動新型傳播體系的構(gòu)建研究”(項目批準(zhǔn)號:14AZD039)階段性研究成果】
【參考文獻】
①[美]威爾伯·施拉姆著、陳亮等譯:《傳播學(xué)概論》,北京:新華出版社,1984年。
②[美]凱斯·R·桑斯坦著、畢竟悅譯:《信息烏托邦:眾人如何生產(chǎn)知識》,北京:法律出版社,2008年。
責(zé)編/周素麗 美編/王夢雅