【摘要】 從人的心智發(fā)展機(jī)理、云端大數(shù)據(jù)以及智能算法等不同的維度來看,智能機(jī)器識別人心是可能實現(xiàn)的。雖然這條路可能還相當(dāng)遠(yuǎn),但官方制度性的認(rèn)可、商業(yè)營利的動機(jī)刺激以及人類探索的好奇心的召喚,正吸引著越來越多的人投身于此。不過,與其他技術(shù)一樣,“識別人心”的效用也是兩面的:一方面可以用于治療和治理,另一方面也需要防止對人類本身的侵犯。它可能成為影響、操縱、控制他人心理和觀點的工具,對這種意識的入侵要保持高度的警覺。
【關(guān)鍵詞】人工智能 識別人心 心智
【中圖分類號】 TP18 【文獻(xiàn)標(biāo)識碼】A
【DOI】10.16619/j.cnki.rmltxsqy.2020.01.002
2016年,幾家初創(chuàng)公司開始銷售智能聊天機(jī)器人。其中有一款機(jī)器人名叫埃米·英格拉姆(Amy Ingram),你只需要把電子郵件抄送給埃米,她就會開始為你做助理工作。埃米有酷似人類的語調(diào),能說會道且談吐不凡。一名用戶說她比人類更能勝任這項工作,有些男人甚至想和她約會。智能機(jī)器人時代正在向我們走來。
“萬物皆數(shù)”是包括圖靈在內(nèi)的許多學(xué)者的觀點,他們思考的是,如果人的五官能夠感受到的世間萬物都可以用機(jī)器轉(zhuǎn)換成數(shù)字來表示,那么人的思考過程自然也可以用機(jī)器轉(zhuǎn)換成數(shù)字來表示。香農(nóng)和奈奎斯特等人的杰出工作,讓人們真正將物理世界的信號編碼成數(shù)字,數(shù)字技術(shù)因之拉開了歷史的序幕。
從大型計算機(jī),到PC機(jī),到移動互聯(lián)網(wǎng),到今天的云計算。六七十余年來,科學(xué)家和工程師們編寫出各種各樣的程序,建立了各種不同的人工智能或機(jī)器學(xué)習(xí)的數(shù)學(xué)模型,推進(jìn)了虛擬現(xiàn)實、無人駕駛、人臉識別、語音助理等技術(shù)的發(fā)展。換言之,機(jī)器今天已經(jīng)擁有了識別語音、圖像和活動場景的能力,它甚至可以與人對話。那么,人心可以識別么?讓機(jī)器看著人的臉,讀懂人的心,正激勵著無數(shù)科學(xué)家的探索。因為這種探索必然會獲得官方制度性的認(rèn)可和商業(yè)營利的動機(jī),而人類探索自身的好奇心也是一種重要的誘導(dǎo)性力量。
本文將從心智的機(jī)理、算法與智能的發(fā)展脈絡(luò)等兩個不同的維度切入,揭示了機(jī)器識別人心的可能性。正如希爾伯特所言:我們必須知道;我們必將知道。
心智的產(chǎn)生及其機(jī)理
1979年,美國考古學(xué)家托馬斯·維恩撰文稱:“現(xiàn)代心智起源于30萬年前。”[1]智人(Homosapiens)的本意是“會思考的人”。[2]瓦爾特將智能分為三個層次:最低層面是“順化智能”,其滿足的標(biāo)準(zhǔn)是心智中的所有的內(nèi)容都來源于感知傳遞;第二層次是“正常智能”,即可以通過自己的力量在自身內(nèi)部產(chǎn)生出知識所依賴的原則;第三個層次是“瘋狂的混合體”,即通過這種智能,一些人可以在缺乏藝術(shù)訓(xùn)練和學(xué)習(xí)的情況下,說出巧妙而讓人嘆服的言語。雖然這些話是真實的,但是別人都沒有看到過、聽到過也沒有被人記錄在案,甚至別人想都沒有想到過,這種智能屬于真正的創(chuàng)造性的能力。[3]
現(xiàn)代人的記憶、推理、判斷、反省、理性,以及使用語言溝通的頭腦才是人目前為止超越其他物種的關(guān)鍵。正所謂人是符號的動物,人是文化之網(wǎng)上的動物所指的就是人類的理性思考(rational thought)的能力。[4]笛卡爾就認(rèn)為語言是人類這個種屬所獨有的能力。也就是說,人的心智的出現(xiàn),使得人擁有了無與倫比的創(chuàng)造性和適應(yīng)性,從而超越了地球上的其他生命形態(tài)。這雖然被一些學(xué)者批評為人類中心主義,但人類的想象力、創(chuàng)造力,尤其豐富語言表達(dá)和虛構(gòu)故事的能力,尚無出其右者。
但人心是什么?人心可以計算么?如果可以計算和測量,那么它能夠被認(rèn)別么?作為碳基的信息處理機(jī)制的人類大腦與作為硅基的計算機(jī)設(shè)備之間真的可以對話甚至相互理解么?要想回答清楚這一系列問題,我們首先要弄清楚何謂人心。
我們這里將人心界定為人的心智活動的總稱。所謂的心智是指“產(chǎn)生和控制知覺、注意、記憶、情緒、語言、決策、思維、推理等心理機(jī)能的成分”,“是形成客觀世界表征的系統(tǒng),促使人們采取行動以實現(xiàn)目標(biāo)”。[5]可見,心智既包括人的認(rèn)識、判斷、思維等的意識活動,也包括人的情感與情緒活動。21世紀(jì)被稱為“腦的世紀(jì)”或“心智的世紀(jì)”。歐盟發(fā)起的“人類大腦計劃”(Human Brain Project, HBP)集結(jié)了歐洲乃至世界上的一批科學(xué)精英,研究如何在超級計算機(jī)中精確地模擬大腦。對人的認(rèn)知和腦的研究,已經(jīng)有了巨大的發(fā)現(xiàn),基于現(xiàn)有的研究成果,對于人的心智問題,我們有如下判斷。
其一,人的心智是自然進(jìn)化的結(jié)果。如果說,柏拉圖在《理想國》已經(jīng)發(fā)現(xiàn)了一些遺傳的奧秘,那么亞里士多德則更進(jìn)了一步,他發(fā)現(xiàn)傳遞信息是遺傳物質(zhì)的核心功能。其后,達(dá)爾文發(fā)現(xiàn)了生物進(jìn)化的規(guī)律,而孟德爾則在修道院花園里進(jìn)行的碗豆雜交實驗中找到了生命進(jìn)化的密碼——基因。盡管在1866到1900年間,孟德爾的文章僅被引用4次,[6]但這一具有劃時代意義的科學(xué)發(fā)現(xiàn),為后續(xù)的研究指明了方向。爾后,埃克弗里根據(jù)基因的化學(xué)形態(tài),確認(rèn)DNA就是遺傳信息的載體。而沃森、克里克、威爾金斯和富蘭克林最終解開了基因的分子結(jié)構(gòu)之謎。現(xiàn)代DNA測序技術(shù)表明人類與黑猩猩有著非常近的親緣關(guān)系。事實上,研究還發(fā)現(xiàn),人類的基因與??灿畜@人的相似性。生命科學(xué)從基因編碼的角度分析指出,今天的人類就是猿的一個分支而已。但研究表明,人類的前額葉-頂葉網(wǎng)絡(luò)的體積要遠(yuǎn)遠(yuǎn)大于與人類血緣最近的其他靈長類動物,這使得人類處理與組合信息的能力遠(yuǎn)超其他物種。不過,人類大腦所積累起來的一系列功能也只是滿足了最原始的進(jìn)化需求——生存與繁衍。理查德·道金斯提出了著名的“自私的基因”學(xué)說就認(rèn)為,基因是進(jìn)化的核心,宿主通過復(fù)制將基因傳給下一代。
其二,心智是一種信息方式。史蒂芬·平克就認(rèn)為,心智是一個由若干計算器官所組成的系統(tǒng),它是我們祖先在解決生存問題的進(jìn)程中“自然選擇”出來的。心智不是大腦,而是大腦所做的事情。人是心智進(jìn)化產(chǎn)物,而不是剃光了毛的“裸猿”。心智進(jìn)化的最終的目的是為了復(fù)制最大數(shù)量的基因,而正式基因創(chuàng)造了心智。他寫道:“所有的人類心理都可以被一個唯一、萬能的理由所解釋:大腦、文化、語言、社會化、學(xué)習(xí)、復(fù)雜性、自組織和神經(jīng)網(wǎng)絡(luò)動力學(xué)”。[7]他認(rèn)為,“視覺、行動、常識、暴力、道德還有愛,無一例外,都是可以厘清的智能的核心組成部分,他們是信息處理的過程”。[8]20世紀(jì)50年代,沃倫·麥卡洛克(Warren McCulloch)等人提出了“心智的計算理論”(Computational Theory of Mind,CTM),該理論的核心觀點是,大腦即是一種計算的機(jī)制,其能力(包括其心理能力)能夠通過計算得以說明。[9]也便是將認(rèn)知過程看作是一種基于規(guī)則的符號操作過程,而心智或大腦則是一種物理符號的系統(tǒng),大腦被看作是生物的硬件,而心智是運行于其上的軟件。[10]
其三,人類一直在探索破解自身的密碼,并且確實找到了越來越科學(xué)的方法和測量工具來測量心智??茖W(xué)家認(rèn)為,大腦實質(zhì)上純粹是起到一個信息的、計算的和控制的功能。因此“其精確的功能組織可以通過語言對其信息功能進(jìn)行準(zhǔn)確的描述,即通過認(rèn)知而非細(xì)胞解剖或者化學(xué)的形式來予以描述”。[11]心理學(xué)家通過核磁共振等神經(jīng)影像技術(shù)比較識字者與文盲的大腦時發(fā)現(xiàn),兩者的大腦活動方式有諸多不同。在測量他們的腦波,用一連串認(rèn)知能力測驗對他們進(jìn)行測試之后,心理學(xué)家得出結(jié)論:閱讀和書寫技能的獲得改變了腦組織結(jié)構(gòu)……不僅在語言上,在視覺感知、邏輯推理、記憶策略和條理性運籌思維上都是如此。[12]
其四,人的意識活動并非純粹的精神活動。笛卡爾相信“機(jī)器中的幽靈”這一教條,他認(rèn)為,一個人的思想是某個“神秘的幽靈”,生存在人這一生物機(jī)器的大腦里面。幾個世紀(jì)以來這種身心二元論一直被很多人認(rèn)可,他們相信意識是人的決定性要素,身體不過是意識和精神活動的障礙物,沉重的肉身牢籠似地困住了精神的超脫,因此在各種宗教教義和傳統(tǒng)的哲學(xué)中,那些力圖摒棄易朽的肉體的實踐成為永恒的贊頌者。但是從19世紀(jì)中期開始,醫(yī)學(xué)和新興的神經(jīng)科學(xué)領(lǐng)域內(nèi)越來越多的證據(jù)表明笛卡爾的二元論站不住腳。自尼采以降,肉身的意義被新發(fā)現(xiàn)和贊美。在尼采那里,“酒神的魔力,使人和人、人和自然、人和神的界限和藩籬消失了。一切都得以解放,一切都達(dá)成了和解,一切都在一個興奮的大海中融為一體,相互吞食、轉(zhuǎn)換、變換”。[13]在尼采看來,感覺、思考和激情都是意志的構(gòu)成部分。他寫道:“身體乃是比陳舊的靈魂更令人驚異的思想。”[14]如今越來越多的人相信,身(肉)體活動體現(xiàn)了一種推動認(rèn)知發(fā)展的所謂“生存意向性”。[15]英國哲學(xué)家吉爾伯特·賴爾(Gilbert Ryle)在1949年出版的著作《心的概念》中指出,笛卡兒的身心二元論犯了一種“范疇錯誤”。他認(rèn)為人的身體和心靈、精神和行為是一回事。
智能、算法與全息連接
“當(dāng)人類走出了‘自我中心’之后,又遭遇了機(jī)器智能的挑戰(zhàn)。這一次,是人-機(jī)交流——即人與物之間的互動——建構(gòu)了存在于人與物之間的公共心智。”[16]圖靈1948年在英國國家物理實驗室(NPL)的一個題為“智能機(jī)器”內(nèi)部報告中提到了“肉體智能”(embodied intelligence)和“無肉體智能”(disembodied intelligence)區(qū)分問題,正式開始對智能的思考。在1950年的Mind雜志上,圖靈發(fā)表文章提出“機(jī)器能夠思考嗎?”。在圖靈測試中,被測試者(人)在一個黑暗的屋子里面與一臺機(jī)器或一個人進(jìn)行對話(當(dāng)時采用的是文本方式,現(xiàn)在可以采用語音方式),若被測試者無法區(qū)分對話的是人還是機(jī)器,則可以稱機(jī)器通過了圖靈測試。“圖靈堅信,人工智能一定能以某種方式實現(xiàn)。”[17]
1952年,發(fā)現(xiàn)了神經(jīng)學(xué)的功能的離子學(xué)說和突觸電位的諾貝爾醫(yī)學(xué)獎得主,艾倫·勞埃德·霍奇金爵士提出了脈沖神經(jīng)網(wǎng)絡(luò)這種神經(jīng)行為學(xué)模型(SNN)。SNN的價值在于,它描述了神經(jīng)元之間的電位是如何產(chǎn)生和流動的,它認(rèn)為神經(jīng)元之間的交換主要靠“神經(jīng)遞質(zhì)”來產(chǎn)生化學(xué)放電,從而在神經(jīng)網(wǎng)絡(luò)中實現(xiàn)復(fù)雜和可變的神經(jīng)系統(tǒng)交互。2011年,IBM發(fā)布了True North芯片,這也是人類用電路模擬神經(jīng)行為學(xué)的開端。2017年,英特爾發(fā)布了類腦芯片Loihi,其擁有13萬個人造突觸。不過,到目前為止,類腦芯片的任務(wù)性處理能力比較差、算力水平也相當(dāng)?shù)?。[18]1956年夏天,在新罕布什爾州達(dá)特茅斯學(xué)院的一次小型會議上,赫伯特·西蒙、約翰·麥卡錫、克勞德·香農(nóng)等AI界的開山鼻祖?zhèn)?,就提出?ldquo;智能的任何特征,原則上都可以精確描述,因此我們可以制造機(jī)器來對它進(jìn)行模擬”。在這次會議上,專家們首次用到“人工智能”這一術(shù)語。這次會議后來被稱之為標(biāo)志性事件——標(biāo)志著人類開始用一種全新的方式來研究心智問題。2013年,由歐盟組織的26個國家135個合作機(jī)構(gòu)參與的“人類腦計劃”(Human Brain Project,簡稱HBP)將重點放在了如何通過超級計算機(jī)技術(shù)來模擬人腦功能,以期實現(xiàn)人工智能。瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)建立了腦與心智研究所(Brain Mind Institute),其科研團(tuán)隊包含了基礎(chǔ)神經(jīng)科學(xué)、計算神經(jīng)科學(xué)、人工智能、機(jī)器人相關(guān)的科研人員,共同從事瑞士藍(lán)腦計劃、歐盟腦計劃相關(guān)的研究。斯坦福大學(xué)成立了心智、腦與計算研究中心(Stanford Center for Mind, Brain and Computation),由認(rèn)知心理學(xué)家、人工神經(jīng)網(wǎng)絡(luò)專家McClelland領(lǐng)導(dǎo)。該中心集成理論、計算和實驗研究的方法,致力于研究感知、理解、思維、感受、決策的腦神經(jīng)信息處理機(jī)制。[19]
在這股探索風(fēng)潮中,逐漸形成了符號主義、聯(lián)結(jié)主義以及行為主義等多種不同的學(xué)派。 “深度學(xué)習(xí)”表現(xiàn)相對突出,尤其“阿爾法狗”(AlphaGo)戰(zhàn)勝全球的圍棋高手后,引起了公眾的廣泛關(guān)注。
不過,紐約大學(xué)教授加里·馬庫斯(Gary Marcus)認(rèn)為,從技術(shù)角度看,深度學(xué)習(xí)可能擅長模仿人類大腦的感知任務(wù),比如圖像或語音識別,但它在理解對話或因果關(guān)系等其他任務(wù)上仍有很大不足?,敻覃愄?middot;博登(Margaret Boden)指出,人工智能一直專注于智力的理性,卻忽略社會/情緒智能,更別提智慧了。她認(rèn)為,人類的心智太豐富,我們還缺乏(能全面說明)心智工作方式的好的心理/計算理論,是以她的結(jié)論是:人類水平的通用人工智能的前景看起來非常渺茫。約翰·塞爾(John Searle)曾經(jīng)通過著名的“中文屋論證”(Chinese Room argument)闡述了人類的“心智”與機(jī)器的計算之間的區(qū)別。塞爾假想有一個不懂中文的人被關(guān)在一間小屋子里,只能通過字條與外面的人進(jìn)行中文符號的交流。房間內(nèi)有一本完美的說明書,看了這本書就可以用中文回答外面的問題。這樣一來,就算只懂英語,房間里的人也可以通過說明書,用中文回答問題了。塞爾假設(shè),只要這個人擁有的規(guī)則足夠完備,那么屋子外面的人就不會懷疑屋子里面的人是懂中文的。塞爾希望通過這個論證表明,通過圖靈測試的計算機(jī)以及會下圍棋的程序,它們和中文屋里面不懂中文的人一樣,只是對符號進(jìn)行規(guī)則化加工而不論符號的意義,而人能夠?qū)?ldquo;意義”作出應(yīng)答。[20]然而,實際上塞爾的論證僅僅表明“通過圖靈測試的計算機(jī)可以沒有智能”,卻沒有提供足夠的證據(jù)表明“計算機(jī)事實上沒有智能”。[21]
不過,人工智能雖然還不足夠智能,但技術(shù)進(jìn)步的結(jié)果往往令人意想不到。牛津大學(xué)計算機(jī)科學(xué)系主任邁克爾·伍爾德里奇(Michael Wooldridge)曾在其著作《多Agent系統(tǒng)引論》中寫道:區(qū)別于地球上的其他生物,不只是因為人類有毋庸置疑的學(xué)習(xí)和解決問題的能力,更是因為人類具有與伙伴通信、合作、達(dá)成一致的能力。這些我們每天都使用的社會能力,是與規(guī)劃和學(xué)習(xí)等智能同等重要的智能行為。他認(rèn)為雖然目前的AI還不能做到“復(fù)雜推理”、“處理定義不清的問題”、“對事物作出判斷”以及“對外界環(huán)境的感知”,他還是相信機(jī)器、設(shè)備同樣具備智能。[22]韓國科學(xué)技術(shù)院生物和大腦工程系的李相完教授在《科學(xué)》雜志上發(fā)表的一篇文章中,提出了一種新的理論——“前頭葉控制”理論。他認(rèn)識到人腦可以自行評價對外部環(huán)境的認(rèn)知度,通過外部信號來處理信息。因此,他認(rèn)為將該原理應(yīng)用于AI算法和機(jī)器人等領(lǐng)域,便可以設(shè)計出能夠根據(jù)外部情況變化,在性能、效率、速度等各個方面自動平衡到最佳狀態(tài)的智能系統(tǒng)。以色列巴伊蘭大學(xué)的科學(xué)家坎特(Ido Kanter)教授和他的合作者最近在《科學(xué)報告》(Scientific Reports)雜志發(fā)表的文章表明,在連接神經(jīng)元的網(wǎng)絡(luò)中,突觸模型中每個神經(jīng)元的學(xué)習(xí)參數(shù)數(shù)量要比樹狀模型中的數(shù)量“明顯更大”。[23]對人工智能充滿樂觀的人不少,如2015年《紐約時報》(New York Times)科技版記者約翰·馬爾科夫(John Markoff)的報道《人工智能的學(xué)習(xí)能力匹敵人類》,就代表了這種典型的觀點。深度學(xué)習(xí)似乎真的已經(jīng)解決了“感知”問題:它具有照片自動分類(圖像識別+分類)、圖像描述生成(圖像識別+理解)等能力。計算機(jī)現(xiàn)在可以比人類更好地識別字符、圖像、物體、聲音、語言,甚至是視頻畫面中的物體。[24]百度用了11940個小時的英語口語來訓(xùn)練他們的語音網(wǎng)絡(luò),現(xiàn)在百度的網(wǎng)絡(luò)轉(zhuǎn)錄語音的能力可以媲美人類?;谒惴?,機(jī)器也可以創(chuàng)造聽起來很自然的短語字幕,以此描述圖像內(nèi)容。2011年1月的一天,美國著名的智力問答競賽節(jié)目《危險邊緣》歷史上最成功的兩位人類選手肯·詹寧斯和布拉德·魯特在節(jié)目中與IBM的一組研究人員開發(fā)的計算機(jī)程序“沃森”比賽(比賽時,它被切斷了互聯(lián)網(wǎng))。為期兩天的挑戰(zhàn)賽結(jié)束時,詹寧斯贏得了24000美元,魯特贏得了21600美元,而“沃森”卻贏得了77147美元,遙遙領(lǐng)先于兩位人類對手。盡管不能說“沃森”有智能,但他這種能讀懂語言,還能夠從自己的記憶庫中找到答案的這種探索、匹配關(guān)系并能識別的能力卻是強(qiáng)大的。
與智能同步推進(jìn)的是基于物聯(lián)網(wǎng)、大數(shù)據(jù)的存貯與數(shù)據(jù)挖掘技術(shù)的進(jìn)步。如果說5G時就能夠通過云網(wǎng)融合、邊緣計算、終端多樣化相結(jié)合,可以獲得有關(guān)每一個聯(lián)網(wǎng)個體的全息數(shù)據(jù),進(jìn)而達(dá)到“信息隨心至,萬物觸手及”的話。那么6G技術(shù)的發(fā)展,則可以達(dá)到“智慧連接”“深度連接”“全息連接”“泛在連接”,使得“一念天地,萬物隨心”成為可能。“一念天地”中的“一念”一詞強(qiáng)調(diào)實時性,指無處不在的低時延、大帶寬的連接,“念”還體現(xiàn)了思維與思維通信的“深度連接”,“天地”對應(yīng)空天地海無處不在的“泛在連接”;“萬物隨心”所指的萬物為智能對象,能夠“隨心”所想而智能響應(yīng),即“智慧連接”;呈現(xiàn)方式也將支持“隨心”無處不在的沉浸式全息交互體驗,即“全息連接”。[25]隨著車聯(lián)網(wǎng)、物聯(lián)網(wǎng)、工業(yè)互聯(lián)網(wǎng)、遠(yuǎn)程醫(yī)療、智能家居、4K/8K、AR/VR、空間網(wǎng)絡(luò)等新業(yè)務(wù)類型和需求的出現(xiàn),未來的網(wǎng)絡(luò)正呈現(xiàn)出一種泛在化的趨勢。劉韻潔院士等預(yù)測說:“在未來,網(wǎng)絡(luò)人工智能將在網(wǎng)絡(luò)的自配置/自管理、網(wǎng)絡(luò)流量自學(xué)習(xí)/自優(yōu)化、網(wǎng)絡(luò)威脅自識別/自防護(hù)和網(wǎng)絡(luò)故障自診斷/自恢復(fù)等方面起到重要作用,在復(fù)雜的網(wǎng)絡(luò)環(huán)境下實現(xiàn)自動化、智能化的網(wǎng)絡(luò)管控。”[26]1983年,羅素(Peter Russell)提出了“全球腦”(global brain)的概念。他認(rèn)為,通過電話、傳真等電信傳播工具,人類將會形成連接緊密的全球網(wǎng)絡(luò)。羅素認(rèn)為,全球人口有可能達(dá)到100億,如果100億人通過通訊設(shè)施連接,“全球腦”即可形成。這個類似于人的大腦的“全球腦”會形成一個具有獨立運作能力的有機(jī)體,具有記憶、思考、反饋等諸多功能。[27]社會的網(wǎng)絡(luò)化以及技術(shù)推進(jìn)的網(wǎng)絡(luò)性聯(lián)結(jié),使得人與人、人與物的信息都流動的云的數(shù)據(jù)化存在著。這種數(shù)據(jù)化、信息化的方式,成為人和人工智能共同的社會環(huán)境和文化環(huán)境,是取之不盡、用之不竭的生產(chǎn)資源。我們在利用機(jī)器進(jìn)行思維時,機(jī)器也在把我們變成它的“齒輪”和“螺絲釘”。[28]網(wǎng)絡(luò)社會不斷進(jìn)化與擴(kuò)張,至腦的最后界限被突破,有學(xué)者稱之為一統(tǒng)(unification)階段。這樣的網(wǎng)絡(luò)是一種“知化網(wǎng)絡(luò)”,它從冰冷的物理連接逐步進(jìn)化為主動感知各類連接設(shè)備……進(jìn)而知曉如何適應(yīng)外界的變化,最終使得整個網(wǎng)絡(luò)具備智能思考的能力,形成自有的知識體系。[29]智能與聯(lián)網(wǎng),提供了大量的數(shù)據(jù),這些數(shù)據(jù)包括了Who(誰)、What(什么)、Where(在哪兒)、When(什么時間)以及Why(為什么)。這5個“W”為機(jī)器識別提供了豐富而相對精確的個人信息。
可識別的“人心”
盡管人們常說“人心難測”,但至少到目前為止,我們使用的是一個“難”字,并沒有表明這是不可能之事。我們看一物,便能知其形、觀其色、辯其質(zhì)。這一看似簡單的意識知覺的背后乃是數(shù)十億大腦神經(jīng)元的精致而復(fù)雜的關(guān)聯(lián)性活動的結(jié)果。“意識是全腦皮層內(nèi)部的信息傳遞,即意識從神經(jīng)網(wǎng)絡(luò)中產(chǎn)生,而神經(jīng)網(wǎng)絡(luò)存在的原因就是腦中有大量分享相關(guān)信息的活動”。[30]雖然人類大腦與計算機(jī)有諸多不同點,但本質(zhì)上都是信息處理機(jī)器。在神經(jīng)科學(xué)領(lǐng)域已經(jīng)出現(xiàn)一些杰出的計算機(jī)模型,其特性與人類大腦神經(jīng)元的生物特性非常接近(最近的一項研究結(jié)果產(chǎn)生的模型具有100萬個神經(jīng)元,5億個聯(lián)結(jié))。這些計算機(jī)模型表明人造神經(jīng)元群體出現(xiàn)了很有意思的新趨勢,如組織集群與活動波。[31]類腦信息處理的研究目標(biāo)就是構(gòu)建高度協(xié)同視覺、聽覺、觸覺、語言處理、知識推理等認(rèn)知能力的多模態(tài)認(rèn)知機(jī)。目前這一方面都取得了不少的進(jìn)展。機(jī)器識別人心初步取得的成就和未來努力的方向主要包括幾方面。
識圖看臉。“眼睛是心靈的窗口”,讀心先讀臉,讀形識臉是識別人心的第一步。人臉識別(Face Recognition)是“一種依據(jù)人的面部特征(如統(tǒng)計或幾何特征等),自動進(jìn)行身份鑒別的一種技術(shù),它綜合運用了數(shù)字圖像、視頻處理、模式識別等多種技術(shù)”。[32]研究發(fā)現(xiàn),對一個人臉部的整體記憶,是由幾千個神經(jīng)元互相作用,綜合產(chǎn)生一種突發(fā)特性才完成的。機(jī)器學(xué)習(xí)和深度算法,已經(jīng)注意到了這種特征,開發(fā)出了越來越復(fù)雜的機(jī)器網(wǎng)絡(luò),以模仿神經(jīng)元的功能。2006年,Hinton教授提出深度信念網(wǎng)絡(luò),這標(biāo)志著深度學(xué)習(xí)理論的誕生,圖形識別技術(shù)得以快速發(fā)展。如今,人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)被廣泛應(yīng)用,使得自動人臉識別成為現(xiàn)實。美國斯坦福大學(xué)李飛飛教授牽頭創(chuàng)立了一個龐大的圖片數(shù)據(jù)庫Image Net,該數(shù)據(jù)庫目前擁有超過1400萬張高分辨率的圖片,標(biāo)注的類別超過2.2萬個。[33]從2010年起,每年舉辦一次大規(guī)模視覺識別挑戰(zhàn)賽(ILSVRC),借此推進(jìn)圖形識別技術(shù)的發(fā)展。2012年參賽的AlexNet深度神經(jīng)網(wǎng)絡(luò)一舉將識別錯誤率下降至15.3%,完勝第2名26.2%的識別錯誤率。2018年,多倫多大學(xué)的研究人員創(chuàng)建了一個神經(jīng)網(wǎng)絡(luò),“讓計算機(jī)擁有了一種神奇的能力來感知照片中的物體”。[34]多倫多大學(xué)的一組研究人員在他們最近關(guān)于這一主題的論文《視頻人臉聚類的面部表征的自我監(jiān)督學(xué)習(xí)》中指出,基于故事情節(jié),更深入地理解視頻,能夠預(yù)測哪些角色何時何地出現(xiàn)。為此,這些研究人員開發(fā)了一種無監(jiān)督模型,能夠根據(jù)現(xiàn)有的數(shù)據(jù)集(如Youtube Faces等面部數(shù)據(jù)庫)和有限的訓(xùn)練來創(chuàng)建高度準(zhǔn)確的面部識別模型。這些模型可以利用基于有序面部距離,動態(tài)生成正/負(fù)約束,并不必僅依賴于目前常用的軌道(track)信息。[35]國內(nèi)也有學(xué)者使用MTCNN算法進(jìn)行人臉檢測,在多姿態(tài)人臉數(shù)據(jù)集上準(zhǔn)確率為96.25%,相較于單一姿態(tài)的人臉數(shù)據(jù)集,準(zhǔn)確率提升了2.67%。[36]
辨音釋義。語言是最好的識別人心的路徑,喬姆斯基認(rèn)為人的心智與語言是同步發(fā)展的。我們可以通過探索和挖掘一個人寫了什么,說了什么而大體判斷出一個人的精神形態(tài)、態(tài)度和立場,這也是當(dāng)下許多人工識別技術(shù)的算法邏輯。語言是人類獨有的符號系統(tǒng),是表情達(dá)意的中介,如果不能理解人類的語言,識讀人心自然也是空話。理解語言,不但要理解各種書面語言的意義(篇章結(jié)構(gòu)、上下文、句子和語詞的含義等),還包括語音理解、非語言性表達(dá)(如人的肢體語言)。喬姆斯基認(rèn)為:“人類語言可以用來告知信息,也可以造成誤導(dǎo),可以用于澄清個人思想,也可以用來表示個人的聰明才智,或者就是為了娛樂。”[37]人類可能用同樣的語詞來表示不同的事物,人們還喜歡借用語言的多義性來實現(xiàn)委婉表達(dá),而且表達(dá)的情境和上下文理解也極為重要,所以計算機(jī)要想真正掌握人類的語言并不容易。“理解不是一件簡單的事情。部分的原因在于語音,語義和拼寫之間的關(guān)系,大部分都帶有主觀任意性……造成語言表征的不同水平之間聯(lián)系困難的另外一個原因是歧義(ambiguity)。在語言領(lǐng)域,歧義是指人們可以對一個發(fā)音、單詞、短語或者句子做出不止一種解釋的現(xiàn)象。”[38]露斯·米利肯(Ruth Milikan)甚至認(rèn)為“思想和語言是生物現(xiàn)象,他們的意義取決于我們的進(jìn)化史”,[39]如果這種觀點是正確的,那么不能進(jìn)化的強(qiáng)人工智能當(dāng)然就不具備真正的理解力。不過雷·庫茲韋爾卻相信“結(jié)合大量并行神經(jīng)網(wǎng)絡(luò)和其他計算模式對系統(tǒng)進(jìn)行訓(xùn)練和演化,使其能理解語言和模型,包括閱讀理解文字文件的能力”。[40]自然語言處理技術(shù)(NPL)就是朝這個方向努力的。目前科學(xué)家運用編譯原理相關(guān)的技術(shù),例如詞法分析、語法分析、語義理解,通過機(jī)器學(xué)習(xí)獲得了很大的突破。被稱為形態(tài)解析(morphological analysis)的算法就是試圖解決語言理解問題的。2016年,微軟的一個團(tuán)隊宣布,他們開發(fā)的一個擁有120層的深度學(xué)習(xí)網(wǎng)絡(luò)已經(jīng)在多人語音識別基準(zhǔn)測試中達(dá)到了與人類相當(dāng)?shù)乃健?0世紀(jì)50年代的一位研究肢體語言的先鋒人物阿爾伯特·麥拉賓(Albert Mehrabian)的研究發(fā)現(xiàn),一條信息所產(chǎn)生的全部影響力中7%來自于語言(僅指文字),38%來自于聲音(其中包括語音、音調(diào)以及其他聲音),剩下的55%則全部來自于無聲的肢體語言。那么,對那些非語言性的表達(dá)的分析也是一項同樣重要的工作。據(jù)報道,卡內(nèi)基梅隆大學(xué)機(jī)器人學(xué)院(CMU RI)的科學(xué)家研發(fā)了一種能解讀人類肢體語言的計算機(jī)系統(tǒng)——Open Pose。該系統(tǒng)使用計算機(jī)視覺和機(jī)器學(xué)習(xí)技術(shù)來處理視頻幀,甚至可以實時跟蹤多個人的肢體運動,包括手和臉部。研究人員亞瑟·謝赫(Yaser Sheikh)表示,這一方法為人們和機(jī)器之間的相互作用開辟了新的方式,人們使用機(jī)器更好地了解周圍的世界。[41]另悉,語言技術(shù)研究所的路易斯-菲利普·莫朗西(Louis-Philipe Morency)使用多模式機(jī)器學(xué)習(xí)來評估病人的非語言行為來幫助醫(yī)生更好地評估抑郁癥和焦慮。[42]賓夕法尼亞州立大學(xué)的一個研究小組也在探索這一領(lǐng)域。該小組處理了大量的電影剪輯,并建立了超過13,000個人物角色的數(shù)據(jù)集,近10,000個身體動作。研究人員利用眾包的人類注釋器來審查電影剪輯,并確定26個分類情緒中的每個人的情感。研究表明,在識別人類情感時,人體可能比面部更具診斷性。[43]
通心會意。20世紀(jì)最著名的實驗心理學(xué)家喬治·米勒(George Miller)在1962年建議應(yīng)當(dāng)在一二十年內(nèi)禁止使用意識這個詞。2019年3月20日,美國哥倫比亞大學(xué)創(chuàng)意機(jī)器實驗室總監(jiān)、工程學(xué)教授霍德·利普森(Hod Lipson)一直在探索打造具有自我意識的機(jī)器。他解釋說:“在機(jī)器人和人工智能領(lǐng)域,我們曾經(jīng)視意識為禁忌,我們不允許觸及這個話題。但在我看來,意識可以說是一個懸而未決的大問題,與生命起源和宇宙起源一樣。什么是感知,什么是創(chuàng)造力?什么是情感?我們想知道人之所以為人的意義,我們也想知道如何人為地創(chuàng)造出這些東西。是時候直面這些問題了。”根據(jù)霍德·利普森的觀點,感知或自我意識的基本構(gòu)建塊之一是“自我模擬”(self-simulation):建立一個人的身體及其在物理空間中如何運動的內(nèi)在表征,然后使用該模型來指導(dǎo)行為。2019年,他率領(lǐng)的研究團(tuán)隊發(fā)明的新興粒子機(jī)器人登上了《自然》雜志封面。他們的創(chuàng)新包括兩個方面:一是這些由“粒子”(即圓盤狀單元)組成的機(jī)械系統(tǒng),不需要人類的強(qiáng)集中控制,也能依靠自主性伸縮和隨機(jī)運動完成復(fù)雜的任務(wù);二是這種系統(tǒng)很可能產(chǎn)生覺知,通過思考“我為什么在這里”進(jìn)而做出自我模擬、自我復(fù)制,從而可以在設(shè)備故障、特殊作業(yè)環(huán)境中順利完成任務(wù)。[44]對于機(jī)器人是否會擁有自主意識問題,霍德·利普森給出了肯定的回答:“這件事情將在10年之后發(fā)生,還是100年之后發(fā)生,我也不知道。但是,我比較確信的是我們的孫輩所生活的世界里,機(jī)器將會有自我意識。”[45]不過,他強(qiáng)調(diào),這個自由意志是可以被人類操控的。人類將和人工智能一起學(xué)習(xí)、一起進(jìn)步。心理學(xué)家就通過詞匯學(xué)假設(shè)(lexical hypothesis)來測量人格。這一假設(shè)首先由英國學(xué)者高爾頓于1884年提出。1936年美國心理學(xué)家G.W.奧爾波特和奧德伯特在英語詞典中找到了17953個描述人格心理特質(zhì)的詞匯,又從中寫出4500個作為歸類分析,歷經(jīng)幾十年、數(shù)代學(xué)人對這些詞匯進(jìn)行篩選和分析,五大人格在不同的實證研究中不斷地被重復(fù)發(fā)現(xiàn),最后被心理學(xué)家公認(rèn)為五大人格特質(zhì)模型。有研究顯示,只要有足夠的社交數(shù)據(jù),不用任何人為的建議,計算機(jī)和算法就可以自動判別一個人的心理特質(zhì),甚至僅僅憑借“點贊”的數(shù)據(jù)就可以完成。如果掌握一個人在Facebook上10個點贊,對他的了解就可能超過他的一般同事;掌握70個就可能超過他的朋友;掌握150個就可能超過其家庭成員;掌握300個就可能超過其最親密的妻子或丈夫了。[46]2008年,劍橋大學(xué)的年輕研究人員邁克爾·科辛斯基(Michal Kosinski)開發(fā)了一項可以在Facebook上進(jìn)行的OCEAN測試。到2012年,根據(jù)Motherboard網(wǎng)站上的一篇文章所述,科辛斯基證明:“平均來說,根據(jù)一名用戶在Facebook上的68個‘愛好’就可以推測其膚色(95%的準(zhǔn)確率)、性取向(88%的準(zhǔn)確率)、親民主黨還是共和黨(85%的準(zhǔn)確率)。”[47]
情緒感知。計算機(jī)對人的心智的理解的另外一個更大的挑戰(zhàn),是對人的感受和情緒的把握。情緒指的是存在于腦和身體之內(nèi)、通常由某個特定的心智內(nèi)容所激發(fā)的一系列機(jī)體變化。感受是對這些機(jī)體變化的知覺。安東尼奧·R.達(dá)馬西奧認(rèn)為:“在意識形成之前,以及在意識作為一種我們常常沒有有意識地認(rèn)識到的誘導(dǎo)物而在我們每個人身上表現(xiàn)出來之前,情緒很可能就已經(jīng)產(chǎn)生并發(fā)展起來了……感受在意識心靈的劇院里發(fā)揮著最根本的、更為持久的作用。”[48]人工智能系統(tǒng)已經(jīng)能夠用多種方式識別人類的部分情感。有些是生理的,如監(jiān)測人的呼吸頻率、心電和腦電反應(yīng);有些是口頭的,如注意說話的語氣、語調(diào)、語速以及用詞習(xí)慣;有些是視覺的,如分析眼動規(guī)律與人的面部表情;有些是運動感知,如身體的移動、手指的運作,等等。[49]美國心理學(xué)家??寺≒aul Ekman)在十九世紀(jì)六十年代提出并在后來發(fā)展起“情緒指紋”理論。他發(fā)現(xiàn)不同民族的語言雖然不同,但對應(yīng)相同基本情緒的面部表情(臉部肌肉運作方式)卻是接近的、普遍的。他還為人類的3000多種有意義的表情總結(jié)了清晰的編碼和規(guī)則。以??寺难芯繛榛A(chǔ),全世界已開發(fā)出多個表情分析系統(tǒng)。比如加州大學(xué)圣地亞哥分校研發(fā)的CERT(表情識別工具箱)可以自動檢測視頻流中的人臉,實時識別“面部表情編碼系統(tǒng)”的30個動作單元組合,包括憤怒、厭惡、恐懼、喜悅、悲傷、驚奇和輕蔑等表情。經(jīng)卡內(nèi)基-梅隆大學(xué)和麻省理工學(xué)院聯(lián)合檢測,CERT的表情識別準(zhǔn)確率達(dá)到80.6%。[50]目前,微軟、IBM 、亞馬遜、京東等公司已經(jīng)開始出售“情緒識別”算法——基于人臉的分析來推測人類的心情。迪士尼公司就開發(fā)了一個觀眾表情分析系統(tǒng)(FVAEs)。在實驗中,研究小組在一個能容納400人的電影院里設(shè)置了4個紅外攝像機(jī),并把FVAEs應(yīng)用到了150部熱播的電影中。在漆黑一片的影廳中,這個系統(tǒng)能夠捕捉觀眾們的哄堂大笑、微微一笑或者悲傷流淚等反應(yīng)。從3179名觀眾中,研究小組最終獲得了1600萬個面部特征的數(shù)據(jù)集合。通過分析這些表情,迪斯尼公司得以知道觀眾是否喜歡這部電影,哪些情節(jié)最能打動人,他們由此可以用量化的方法對電影的情節(jié)設(shè)計進(jìn)行評價。
2014年年底,日本著名的投資公司軟銀在新聞發(fā)布會上展示了一個名叫“胡椒”(Pepper)的智能機(jī)器人,它通過“情緒引擎”和云計算來辨識分析人類的表情、肢體動作、語調(diào)和情緒。據(jù)稱,“Pepper”還能提供保姆、護(hù)理、急救等服務(wù),而且具備學(xué)習(xí)和情感表達(dá)等能力。軟銀CEO孫正義稱:“人們常把一些沒有感情、沒有心的人稱為‘機(jī)器人’,我們在人類歷史上第一次給了機(jī)器人感情和心。”[51]當(dāng)然,真正確認(rèn)并理解人的情感,不是一件很容易的事,因為就算是人與人之間的情感把握也是難題,比如我們經(jīng)常忽視遺漏與我們交流的對象的細(xì)微情緒波動,也常常曲解對方的情感反應(yīng)。有學(xué)者撰文指出,“情緒指紋”理論在方法論上存在缺陷。有學(xué)者通過對數(shù)百個實驗的分析得出結(jié)論是:在自主神經(jīng)系統(tǒng)中,不同的情緒并沒有一致的特定指紋。一種精神活動(如恐懼)竟然不是由一組神經(jīng)元創(chuàng)造的。相反,只有不同的神經(jīng)元組合起來才能產(chǎn)生恐懼。在美國心理科學(xué)協(xié)會的委托下,五位科學(xué)家展開了數(shù)據(jù)收集和科學(xué)證明。他們的研究成果顯示,情緒的表達(dá)方式多種多樣,很難從一組簡單的面部運動中可靠地推斷出一個人的感受,表情與心情之間沒有堅實的科學(xué)依據(jù)證明有直接關(guān)聯(lián)。該論文的作者之一,馬薩諸塞州的東北大學(xué)心理學(xué)教授莉莎·費德曼·巴瑞特(Lisa Feldman Barrett)在接受媒體采訪時表示,數(shù)據(jù)顯示,人們在生氣時,平均只有不到30%的時間會皺眉。所以愁眉苦臉不是憤怒的表現(xiàn),而只是眾多憤怒表達(dá)之一。這意味著超過70%的情況下,人們在生氣的時候不會皺眉。最重要的是,他們在不生氣的時候經(jīng)常會皺眉。Barrett說,雖然“能檢測到一張憤怒的臉,但這與察覺到憤怒的情緒是兩碼事。”[52]當(dāng)然,這些批評都無法斷言情緒識別是不可能的。事實可能是目前做不到精確的識別,只是因為還有沒有找到更科學(xué)的方法。紐約大學(xué)教授加里·馬庫斯(Gary Marcus)就指出,目前普遍使用的深度學(xué)習(xí)技術(shù)可能擅長模仿人類大腦的感知任務(wù),比如圖像或語音識別。但它在理解對話或因果關(guān)系等其他任務(wù)上仍有很大不足。是以斯坦福大學(xué)教授李飛飛所言,(深度學(xué)習(xí))無論在智力、人力或機(jī)器設(shè)備方面,都還有很長的路要走。為了創(chuàng)造能力更強(qiáng)、智能范圍更廣的機(jī)器,也就是俗稱的通用人工智能,深度學(xué)習(xí)必須與其他方法相結(jié)合。馬庫斯和歐內(nèi)斯特·戴維斯(Ernest Davis)在他們的新書《重啟人工智能》(Rebooting AI)中主張開辟一條新的前進(jìn)道路,他們認(rèn)為其中一些可能來自我們?nèi)绾螛?gòu)建算法的規(guī)則。未來,AI可以通過語音識別、視覺識別、文字識別、表情識別等數(shù)據(jù),結(jié)合深度學(xué)習(xí),再加上人工的標(biāo)記,從而具備識別情緒的能力。
總之,智能技術(shù)目前看起來還相當(dāng)不成熟,但至少它們已經(jīng)可以在一定程度上認(rèn)識人心了。
總結(jié)
人類與猿類有什么區(qū)別?歷史學(xué)家尤瓦爾·赫拉利(Yuval Harari)在《人類簡史》(Sapiens: A Brief History of Humankind)一書中認(rèn)為,人類與其他生物的不同點之一是我們會集體說謊。無論任何,人都是這個世界上最復(fù)雜、最智能的生物。人類的大腦包含了無數(shù)的智能組合和聯(lián)結(jié)(要特別注意這種聯(lián)結(jié)的意義,因為“思考、感受和行動都是依靠許多神經(jīng)元的綜合活動,而不是單一細(xì)胞的產(chǎn)物”[53])。
我們與生俱來就有腦中樞,它們控制著各種感覺和肌肉群的移動(如眼睛和四肢的活動),讓我們能夠區(qū)分聲音和語言,區(qū)分面孔的特征,區(qū)分各種不同的觸感、味道和氣味;我們天生就帶有原型專家,他們參與到我們的饑餓、歡笑、恐懼、憤怒、睡眠和性生活中??隙ㄟ€有其他許多尚未被發(fā)現(xiàn)的功能,每個功能都依托于某種不同的結(jié)構(gòu)和操作模式。“成千上萬的基因參與安排了這些智能組合以及它們之間的神經(jīng)束”。[54]人類的大腦有著超長的短時間記憶的能力,且能夠基于情境需要而隨時調(diào)動這些記憶單元,并加以重新組合,以應(yīng)對隨時面臨著的復(fù)雜的外部環(huán)境的變化。所以,機(jī)器要想完整讀懂人心自然不是件簡單之事。至少到目前為止,還沒有發(fā)現(xiàn)人工智能可以達(dá)到共情式理解的能力,也可能還做不到自主編造謊言,所以機(jī)器要真正讀懂人心還早得很。但正如前文所述,人工智能已經(jīng)在一定程度上可以讀懂人類創(chuàng)造的多種符號甚至是進(jìn)行創(chuàng)作,如機(jī)器人寫作已經(jīng)被廣泛運用于新聞報道[55]、繪畫、創(chuàng)作音樂和詩歌。[56]
人工智能正越來越有能力識別人心,但這還不意味著機(jī)器有意識和思維力。有學(xué)者將人類心智進(jìn)化的歷程分為五個層級:神經(jīng)層級的心智、心理層級的心智、語言層級的心智、思維層級的心智和文化層級的心智。[57]比照一下人工智能的進(jìn)化程度,可見它還遠(yuǎn)未達(dá)到思維和文化的層級。因此人工智能領(lǐng)域先驅(qū)者馬文·閔斯基認(rèn)為,智能機(jī)器人可以完成具有超高智商的人類都無法完成的事,但很多小孩子都能做到的事,它卻做不到——比如,產(chǎn)生一點點思維意識。目前的人工智能僅屬于弱人工智能,無非是讓機(jī)器具有某種智能的行為,它卻沒有達(dá)到強(qiáng)人工智能的自主意識——機(jī)器能夠真正地像人類一樣思考(can machine really think)。從識別人心的視角看,當(dāng)下的技術(shù)突破難點還處于識讀人的心境、感受、情緒方面。黃欣榮就認(rèn)為:“機(jī)器畢竟是機(jī)器,在體力、智力方面勝過人類,但在情感、意志等方面,機(jī)器還無法匹敵人類。因為人工智能目前仍是有智力沒智慧。”[58]涂子沛曾預(yù)測:“表情分析、情感計算,未來將會和更多的傳感器、可穿戴設(shè)備所獲得的數(shù)據(jù)相結(jié)合,即通過人類的表情、語言、手勢、大腦信號、心血管血流速度等生理數(shù)據(jù),實現(xiàn)對人的情緒、生理狀態(tài)的全面解讀?;谶@些數(shù)據(jù),機(jī)器可以對人類的生理、心理甚至是情緒的變化進(jìn)行預(yù)測。機(jī)器作出的這種解讀和預(yù)測要比人類更為準(zhǔn)確。”[59]史蒂芬·霍金在其遺作《大問題簡答》(Brief Answers to the Big Questions)中斷言,計算機(jī)可以模擬甚至超越人類智能。他預(yù)測說,若計算機(jī)的發(fā)展?jié)M足“摩爾定律”(Moore's Law)——即運算速度每十八個月翻一番,則將在百年之內(nèi)超越人類智能。[60]也許到了那一天,一個比我們自己還懂我們的幽靈才會出現(xiàn)。雷·庫茲韋爾對這一天更是充滿憧憬,他寫道:“正是存在于世——有體驗、有意識,才有心靈而言,這也是心靈的本質(zhì)。機(jī)器由人類思維演變而來,卻在體驗?zāi)芰Ψ矫娉^了人類,因此它們也可以被認(rèn)為是有意識、有心靈的,至少機(jī)器們自己對這點深信不疑,認(rèn)為它們也經(jīng)歷過有意義的心靈體驗。”[61]
當(dāng)然,話又說回來,我們?nèi)祟愖约汉卧嬲軌蜃x懂別人的心呢。胡塞爾預(yù)示了一種“人同此心,心同此理”的同理心機(jī)制的存在。我和他和你之間之所以能夠產(chǎn)生同理心,是因為我們同處一個生活的世界,我們可能會有相似的生活體驗。“同情感的缺失,在相當(dāng)程度上,或許便是與兩個相關(guān)主體各自所具有的生活的差異性有關(guān)的。”[62]海德格爾給人們超越庸常的日常生活的出路是“向死而生”,這種根本性出路的核心是“畏”——對所有存在的虛無化的恐懼。至少到目前為止,機(jī)器不能體驗人的生活世界,無法理解“向死而生”,無法真正理解“畏”。[63]是以,對機(jī)器完全讀懂人心的演進(jìn)程度還沒有必要給予苛求,何況基本讀懂,甚至比他人更好地讀懂我心的可能性還是存在的。
2016年6月3日,微軟聯(lián)合創(chuàng)始人比爾·蓋茨在南加州舉辦的Code Conference大會上表示:“人工智能的夢想今天終于實現(xiàn)了,這是一件好事,也是一件壞事,因為這對未來的人類來說,可能會成為一大擔(dān)憂。”讀懂人心,與其他技術(shù)一樣,效用都是兩面的:一方面可以用于治療和治理,但另一方面也需要防止對人類本身的侵犯。2018年,倫敦咨詢機(jī)構(gòu)“劍橋分析”(Cambridge Analytica)遭到英國數(shù)據(jù)監(jiān)管機(jī)構(gòu)——信息專員辦公室(ICO)突擊調(diào)查。這家公司涉嫌非法獲取Facebook數(shù)據(jù)以建立美國選民檔案、左右美國大選走向。據(jù)報道,“劍橋分析”與2016年特朗普競選團(tuán)隊合作,利用了多達(dá)8700萬名Facebook用戶的個人檔案建立起個人信息系統(tǒng),以預(yù)測和影響民意選擇,讓選民們在2016年總統(tǒng)選舉中投票給特朗普。劍橋公司的所作所為之所以受到高度關(guān)注,是因為他們把8700萬人的社交數(shù)據(jù)與美國商業(yè)市場上2.2億人的消費數(shù)據(jù)進(jìn)行匹配、組合和串聯(lián),找出誰是誰,然后就這些人的性格、年齡、興趣愛好、性格特點、職業(yè)專長、政治立場、觀點傾向等上百個維度給人打上標(biāo)簽,并基于這些數(shù)據(jù)進(jìn)行心理畫像、建立心理檔案,再通過這些心理檔案開展分析,總結(jié)出不同人群的希望點、恐懼點、共鳴點、興奮點、煽情點以及“心魔”所在。劍橋公司運用的顯然是一種新型讀心術(shù)。當(dāng)然,這種讀心術(shù)還是基于數(shù)據(jù)分析師和計算機(jī)共同完成的。其實,即使是通過公開的數(shù)據(jù),人工智能也可以成為影響、操縱、控制他人心理和觀點的工具,這種心理入侵、思想入侵和意識入侵的行為更應(yīng)該引起廣泛的關(guān)注。據(jù)說,未來的人類將會改變通過視、聽、觸覺與人工智能交流的方式,而是通過腦機(jī)接口更直接地操作人工智能系統(tǒng)這個新的“超級大腦”。[64]這一前景,看起來是那么令人向往,也許未來我就不用那么刻苦地學(xué)習(xí)讀書了,識別人心也變得輕而易舉,女孩子的心思再也不用猜了。諾貝爾物理獎得主理查德·費曼(Richard Phillips Feynman)曾說道:“在某種程度上,科學(xué)是開啟天堂之門的鑰匙,但它同樣可以打開地獄之門。我們沒有得到任何指點來知曉哪個門是通往天堂之門。但為此我們就該把鑰匙扔掉,從此放棄進(jìn)入天堂之門的求索?抑或我們該就什么是運用這把鑰匙的最佳方式繼續(xù)爭論?這當(dāng)然是個非常嚴(yán)肅的問題,但我認(rèn)為,我們不能就此否認(rèn)這把天堂之門的鑰匙本身的價值。”[65]誠哉,斯言。
(本文系國家社科基金重點項目“新媒體環(huán)境下公共傳播的倫理與規(guī)范研究”的中期成果,項目編號:19AXW007[2019])
注釋
[1][英]喬治·扎卡達(dá)基斯:《人類的終極命運:從舊石器時代到人工智能的未來》,陳朝譯,北京:中信出版社,2017年,第20頁。
[2]從解剖學(xué)上來說,早在15萬年前,人類從各個方面看就已經(jīng)算現(xiàn)代人了,但沒有為后世留下任何證據(jù)表明當(dāng)時人類具有抽象思維或象征性思維能力。大約4萬年前,人類開始生產(chǎn)藝術(shù)品、首飾和高級工具,如水壺和釣鉤。我們制造的都是彌補(bǔ)我們?nèi)狈Φ纳韺傩缘墓ぞ?。參見[挪]卡婭·努爾英恩:《大腦帝國》,余韜潔譯,北京:中信出版社,2018年。
[3][37]參見[美]諾姆·喬姆斯基:《語言與心智》,熊仲儒、張孝榮譯,北京:中國人民大學(xué)出版社,2015年,第9~10、76頁。
[4]顏君蓉、王仟雅、楊忠憲:《Cyborg與信息社會的未來》,《網(wǎng)絡(luò)社會學(xué)通訊期刊》(臺灣嘉義),2005年(總)第49期,http://mail.nhu.edu.tw/~society/e-j/49/49-06.htm。
[5][美]E. Bruce Goldstein:《認(rèn)知心理學(xué):心智、研究與你的生活》,北京:中國輕工業(yè)出版社,2018年,第4頁。
[6][美]悉達(dá)多·穆克吉:《基因傳:眾生之源》,馬向濤譯,北京:中信出版社,2018年,第46頁。
[7][8][美]史蒂芬·平克:《心智探奇:人類心智的起源與進(jìn)化》,郝耀偉譯,杭州:浙江人民出版社,2016年,第5、20頁。
[9][加]薩伽德:《認(rèn)知科學(xué)導(dǎo)論》,朱菁、陳夢雅譯,上海辭書出版社,2012年,第11頁。
[10][美]R.M.哈尼什:《心智大腦與計算機(jī):認(rèn)知科學(xué)創(chuàng)立史導(dǎo)論》,王淼、李鵬鑫譯,杭州:浙江大學(xué)出版社,2012年,第11頁。
[11][美]Michael S·Gazzaniga、Richard B·Ivry、George R·Mangun:《認(rèn)知神經(jīng)科學(xué)》,北京:中國輕工業(yè)出版社,2017年,第554頁。
[12][美]凱文·凱利:《技術(shù)元素》,張行舟、余倩、周峰等譯,北京:電子工業(yè)出版社,2012年,第16頁。
[13]汪民安:《尼采與身體》,北京大學(xué)出版社,2008年,第2頁。
[14][德]尼采:《權(quán)力的意志》,陳念東、凌素心譯,北京:中央編譯出版社,2000年,第22頁。
[15]李恒威、盛曉明:《認(rèn)知的具身化》,《科學(xué)學(xué)研究》,2006年第2期,第184頁。
[16]蔣柯:《“圖靈測試”、“反轉(zhuǎn)圖靈測試”與心智的意義》,《南京師大學(xué)報(社會科學(xué)版)》,2018年4期,第76~82頁。
[17][39][49][英]瑪格麗特·博登(Margaret A. Boden):《AI:人工智能的本質(zhì)與未來》,孫詩惠譯,北京:中國人民大學(xué)出版社,2017年,第11、159、86頁。
[18]《類腦芯片簡史:它會是AI的終極答案嗎?》,https://www.tmtpost.com/4182412.html。
[19]曾毅、劉成林、譚鐵牛:《類腦智能研究的回顧與展望》,《計算機(jī)學(xué)報》, 2016年第39卷第397期 ,第214~224頁。
[20][美]塞爾:《心、腦與科學(xué)》,楊音萊譯,上海譯文出版社,2006年。轉(zhuǎn)引自王佳、朱敏:《對強(qiáng)人工智能及其理論預(yù)設(shè)的考察——基于中文屋論證的批判視角》,《心智與計算》,2010年第1期。
[21]楊曉愛、魏屹東:《中文屋論證究竟證明了什么?——由“中文屋論證”引發(fā)的計算機(jī)思維問題探析》,《山西大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》,2013年第2期。
[22][英]伍德里奇(Michael Wooldridge):《多Agent系統(tǒng)引論》,石純一譯,北京:電子工業(yè)出版社,2003年。轉(zhuǎn)引自:https://mp.weixin.qq.com/s/5aEx8iwuMFFemuwW6-_UFw。
[23]Herut Uzan; Shira Sardi; Amir Goldental; Roni Vardi and Ido Kanter, "Biological learning curves outperform existing ones in artificial intelligence algorithms", Scientific Reports, 2019, 9 (1).
[24][美]阿米爾·侯賽因(Amir Husain):《終極智能:感知機(jī)器與人工智能的未來》,賽迪研究院專家組譯,北京:中信出版集團(tuán),2018年,第26頁。
[25]趙亞軍、郁光輝、徐漢青:《6G移動通信網(wǎng)絡(luò):愿景、挑戰(zhàn)與關(guān)鍵技術(shù)》,《中國科學(xué):信息科學(xué)》,2019年第8期。
[26]黃韜、 霍如、劉江等:《未來網(wǎng)絡(luò)發(fā)展趨勢與展望》,《中國科學(xué):信息科學(xué)》, 2019年第8期。
[27]蘇健華:《Cyborg與全球腦對人類與社會的沖擊》,臺灣:《網(wǎng)絡(luò)社會學(xué)通訊期刊》,2001年第17期。
[28]趙濤:《超文本·全球腦·內(nèi)爆——網(wǎng)絡(luò)世代思想生產(chǎn)的社會學(xué)考察》,《社會科學(xué)戰(zhàn)線》,2006年第6期,第38~42頁。
[29]魏慧:《數(shù)據(jù)決定智能,運營商預(yù)研“知化網(wǎng)絡(luò)”》,《通信世界》, 2016年第12期,第19頁。
[30][法]斯坦尼斯拉斯·迪昂:《腦與意識:破解人類思維之迷》,章熠譯,杭州:浙江教育出版社·湛廬文化,2018年,第30頁。
[31][英]丹尼爾·博爾(Daniel Bor):《貪婪的大腦:為何人類會無止境地尋求意義》,林旭文譯,北京:機(jī)械工業(yè)出版社,2013年,第22頁。
[32]王心醉、郭立紅、肖永鵬等:《基于BDPCA和KNN的人臉識別算法》,《武漢理工大學(xué)學(xué)報》,2009年第19期,第136~139頁。
[33]Russakovsky et al.,"ImageNet Large Scale Visual Recognition Challenge"; Alex Krizhevsky; Ilya Sutskever and Geoffrey E.Hinton, "ImageNet Classification with Deep Convolutional Neural Networks", Proceedings of the 25th International Conference on Neural Information Processing Systems, Lake Tahoe, NV, December3–6, 2012, pp. 1097–1105.
[34][美]肖恩·格里什:《智能機(jī)器如何思考:深度神經(jīng)網(wǎng)絡(luò)的秘密》,張羿譯,北京:中信出版社,2019年,第144頁。
[35]"The Best Machine Learning Research of 2019 So Far", https://medium.com/@ODSC/the-best-machine-learning-research-of-2019-so-far-954120947794,本文引用轉(zhuǎn)自云水木石的博客文章,《2019年機(jī)器學(xué)習(xí)方面的最新研究》,https://blog.csdn.net/mogoweb/article/details/95136285。
[36]龔銳、丁勝、章超華等:《基于深度學(xué)習(xí)的輕量級和多姿態(tài)人臉識別方法》,《計算機(jī)應(yīng)用》,2019年10月。
[38]Edward E. Smith / Stephen M. Kosslyn:《認(rèn)知心理學(xué):心智與腦》,乃弋、羅躍嘉譯,北京:教育科學(xué)出版社,2017年,第539頁。
[40][美]雷·庫茲韋爾:《機(jī)器之心》,胡曉姣、吳純潔、張溫、卓瑪譯,北京:中信出版社,2016年,第7頁。
[41]Carnegie Mellon University, "Computer that reads body language: Real-time detector sees hand poses and tracks multiple people", Science Daily, 6 July 2017, www.sciencedaily.com/releases/2017/07/170706143158.htm.
[42]Andrew Moore:《為什么2016年是機(jī)器人情緒識別的分水嶺?》,網(wǎng)易科技,2016年1月18日,http://tech.163.com/16/0118/10/BDJUIQ4400094P0U.html。
[43]《計算機(jī)是否可以訓(xùn)練以理解肢體語言》,風(fēng)尚網(wǎng),2019年9月6日,http://www.gjfs.com.cn/keji/201909/090621002.html。
[44]《粒子機(jī)器人,能否敲開機(jī)器意識覺醒之門?》,鈦媒體,2019年11月6日,https://www.tmtpost.com/4185426.html。
[45]《美國權(quán)威機(jī)器人專家Hod Lipson:機(jī)器人終將擁有自主意識!》,機(jī)器人,2019年11月4日,https://www.roboticschina.com/news/2904.html。
[46] Wu Youyou; Michal Kosinski and David Stillwell, "Computer-based personality judgments are more accurate than those made by humans", Proceedings of the National Academy of Sciences of the United States of America, 2015(4), pp. 1036-1040.
[47]Hannes Grassegger and Mikael Krogerus, "The Data That Turned the World Upside Down", Motherboard, January 28, 2017, last accessed on August 2, 2017, https:// motherboard.vice.com/en_us/article/mg9vvn/how-our-likes-helped-trump-win.
[48] [美]安東尼奧·R.達(dá)馬西奧:《感受發(fā)生的一切:意識產(chǎn)生中的身體和情緒》,楊韶剛譯,北京:教育科學(xué)出版社,2007年,第31頁。
[50]涂子沛:《數(shù)文明:大數(shù)據(jù)如何重塑人類文明、商業(yè)形態(tài)和個人世界》,北京:中信出版集團(tuán),2018年,第307頁。
[51]《關(guān)于日本推出的情感機(jī)器人“佩珀”的性能分析和應(yīng)用》,http://m.elecfans.com/article/1032879.html。不過,也有人指出 “Pepper并非基于機(jī)器學(xué)習(xí)和人工智能,而是由工程師編寫程序以聯(lián)接傳感器的輸入和相應(yīng)的情感效果”。國內(nèi)評測人王自如則表示,Pepper可能遠(yuǎn)談不上可以辨識人類的情緒,甚至連正常的交流都做得不是那么好。https://www.sogaa.net/portal/news/detail?id=132d7f5e-b7cb-4f9c-8d6f-2aa801ed2e2e
[52]《用AI讀懂人心?情感科學(xué)專家:靠表情識別情緒不靠譜》,騰訊新聞,2019年7月29日,https://new.qq.com/omn/20190729/20190729A0CZ7Z00.html
[53][美]布魯斯·E. 韋克斯勒( Bruce E. Wexler):《大腦與文化》,羅俊、汪思綺、姚桂桂譯,杭州:浙江大學(xué)出版社·啟真館,2016年,第2頁。
[54][美]馬文·明斯基(Marvin Minsky):《心智社會:從細(xì)胞到人工智能,人類思維的優(yōu)雅解讀》,任楠譯,北京:機(jī)械工業(yè)出版社,2016年,第405頁。
[55]騰訊早在2015年就啟用了名為“Dreamwriter”的智能新聞寫作機(jī)器人。這款智能機(jī)器人可以依靠算法實時組建稿件,并能瞬間解讀出各種分析和判斷,一分鐘內(nèi)就可以完成重要的短訊。
[56]從2015年6月10日始,谷歌的工程師發(fā)表了許多由人工神經(jīng)網(wǎng)絡(luò) “深夢”(Deep Dream)生成的照片。其中一張照片充滿了狗臉、眼睛、詭異的螺旋圖案,有種異樣的魔性。難道機(jī)器真的有思考藝術(shù)的思維嗎?
[57]蔡曙山、薛小迪:《人工智能與人類智能——從認(rèn)知科學(xué)五個層級的理論看人機(jī)大戰(zhàn)》,《北京大學(xué)學(xué)報(哲學(xué)社會科學(xué)版)》,2016年第53卷第4期,第145~154頁。
[58]黃欣榮:《人工智能對人類勞動的挑戰(zhàn)及其應(yīng)對》,《理論探索》,2018年第5期,第15~21頁。
[59]涂子沛:《數(shù)文明:大數(shù)據(jù)如何重塑人類文明、商業(yè)形態(tài)和個人世界》,北京:中信出版集團(tuán),2018年,第309~310頁。
[60][英]史蒂芬·霍金:《十問:霍金沉思錄》,吳忠超譯,長沙:湖南科學(xué)技術(shù)出版社,2019年,第109頁。
[61][美]雷·庫茲韋爾:《機(jī)器之心》,胡曉姣、吳純潔、張溫、卓瑪譯,北京:中信出版社,2016年,第174頁。
[62]徐英瑾:《歐陸現(xiàn)象學(xué)對人工情緒研究的挑戰(zhàn)》,《探索與爭鳴》,2019年第10期,第137~147頁。
[63]影視劇中機(jī)器人大多是具有意識和感情的。如在《未來世界》中,機(jī)器有愛恨情仇。在《人工智能》中,機(jī)器人小戴維在人類組織的一次次機(jī)器人解體秀中,目睹了其他機(jī)器人被摧毀的慘狀,并產(chǎn)生了對自身生存之有限性的意識。
[64]張曉林:《類腦智能引導(dǎo)AI未來》,《自然雜志》,2018年第40卷第5期,第35~40頁。
[65][美]R·P·費曼:《費曼講演錄:一個平民科學(xué)家的思想》,王文浩譯,長沙:湖南科學(xué)技術(shù)出版社,2012年,第5頁。
AI Will Eventually "Read Mind"
Wu Fei
Abstract: From the different dimensions of the mechanism for human mental development, cloud big data and intelligent algorithm, the intelligent machine recognition of human mind is feasible. Although there is still a long way to go, more and more people are attracted to it due to the institutional affirmation by the authorities, the profitable prospect and the human curiosity. However, like other technologies, the effect of "mind reader" has two sides: on the one hand, it can be used for treatment and governance, and on the other hand, it needs to prevent the invasion of human beings themselves. It may become a tool to influence, manipulate and control other people's psychological state and views. We should keep a high degree of vigilance against the invasion of this consciousness.
Keywords: AI, read mind, intelligence
吳飛, 浙江大學(xué)求是特聘教授,浙江大學(xué)公共外交與戰(zhàn)略傳播研究中心主任。研究方向為新聞傳播理論、技術(shù)哲學(xué)、國際傳播。主要著作有《國際傳播的理論、現(xiàn)狀與發(fā)展趨勢研究》《火塘·教堂·電視——一個少數(shù)民族社區(qū)社會傳播網(wǎng)絡(luò)分析》《傳播學(xué)的想象力》等。
責(zé) 編/馬冰瑩