黄色网页在线观看,开放性按摩在线观看,探花国产精品福利,三级特黄60分钟在线播放,一本久道久久综合中文字幕,五月婷婷激情网,久久精品国产精品国产精品污

網(wǎng)站首頁 | 網(wǎng)站地圖

大國新村
首頁 > 原創(chuàng)精品 > 成果首發(fā) > 正文

人工智能大模型發(fā)展的新形勢及其省思

【摘要】隨著相關(guān)技術(shù)的不斷進步,大模型發(fā)展呈現(xiàn)出與數(shù)據(jù)要素深度融合、其日益沉淀為基礎(chǔ)設(shè)施、發(fā)展焦點從底座模型轉(zhuǎn)移至應(yīng)用生態(tài)等新的趨勢。針對大模型產(chǎn)業(yè)發(fā)展呈現(xiàn)出的新態(tài)勢、新動向,我們要樹立大模型發(fā)展的全局觀和整體觀,積極采取加快建設(shè)人工智能教育體系、建立以智能科學(xué)為核心的跨學(xué)科研究體系、推動大模型與數(shù)據(jù)要素協(xié)同發(fā)展并堅持多元化的大模型發(fā)展路徑等新的應(yīng)對舉措。作為一種先進技術(shù),大模型具有兩面性,我們在積極采取措施促進其良性發(fā)展并釋放其應(yīng)用價值的同時,也要密切關(guān)注其濫用、誤用與惡用所帶來的虛假內(nèi)容泛濫、影響人類心智和能力的發(fā)展與培育等負面問題,未雨綢繆積極做好風(fēng)險治理與管控。

【關(guān)鍵詞】大模型 人工智能 風(fēng)險管控 大模型應(yīng)用落地

【中圖分類號】TP18/F49 【文獻標(biāo)識碼】A

【DOI】10.16619/j.cnki.rmltxsqy.2024.13.004

【作者簡介】肖仰華,復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授、博導(dǎo),上海市數(shù)據(jù)科學(xué)重點實驗室主任。研究方向為知識圖譜、知識工程、大數(shù)據(jù)管理與挖掘。主要著作有《圖對稱性理論及其在數(shù)據(jù)管理中的應(yīng)用》、《知識圖譜:概念與技術(shù)》(合著)、《生成式語言模型與通用人工智能:內(nèi)涵、路徑與啟示》(論文)等。

 

自2022年底OpenAI發(fā)布ChatGPT以來,大模型產(chǎn)業(yè)發(fā)展先后經(jīng)歷了百模大戰(zhàn)、追求更大參數(shù)、刷榜競分,直到近期各大廠商相繼加入價格戰(zhàn),可謂熱點紛呈。大模型的技術(shù)形態(tài)也從單純文本發(fā)展到了多模態(tài),從模擬人類大腦的認知功能發(fā)展到操控機器身體進而與復(fù)雜環(huán)境交互,從通用發(fā)展到專業(yè)與行業(yè)大模型,大模型技術(shù)生態(tài)日益繁榮。熱鬧的產(chǎn)業(yè)發(fā)展背后涌動的是科技巨頭對通用人工智能(Artificial General Intelligence,簡稱AGI)技術(shù)賽道的激烈拼搶,是大國科技競爭態(tài)勢的愈演愈烈。如果說ChatGPT打響了通用人工智能技術(shù)革命的第一槍,那么當(dāng)下AGI產(chǎn)業(yè)競爭似乎進入了多點開花、犬牙交錯的局面,未來走勢并不清晰。與此同時,大模型產(chǎn)業(yè)發(fā)展過程中的各種問題也日益突出:各廠商仍在艱難摸索大模型變現(xiàn)路徑、研發(fā)投入仍在持續(xù)增長、需求方的耐心不斷被消磨,對生成式大模型的根本性問題(比如幻覺問題)仍然缺乏有效應(yīng)對策略、大模型訓(xùn)練與應(yīng)用的資源與能源消耗問題日益突出。久而久之,大模型廠商成本壓力增大,市場也逐漸冷靜。此外,大模型技術(shù)大規(guī)模應(yīng)用所帶來的各種社會問題也逐漸凸顯。大模型產(chǎn)業(yè)似乎進入了一個中場階段,盤點與反思當(dāng)前發(fā)展態(tài)勢、梳理與總結(jié)發(fā)展中的問題、展望與謀劃未來對策成為推動大模型產(chǎn)業(yè)進一步發(fā)展的重要議題。

大模型發(fā)展的新態(tài)勢

大模型日益成為人工智能產(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施。從大模型的基本內(nèi)涵來看,其勢必演變?yōu)槿斯ぶ悄墚a(chǎn)業(yè)發(fā)展的基礎(chǔ)設(shè)施。從字面上的意義來看,大模型即大規(guī)模參數(shù)化的深度神經(jīng)網(wǎng)絡(luò),海量參數(shù)是其根本特征。大模型需要大規(guī)模算力和海量數(shù)據(jù)進行訓(xùn)練,也因此成為人工智能的重型裝備,這也宣告AI(Artificial Intelligence,人工智能)進入了重工業(yè)發(fā)展階段,而重型裝備往往是產(chǎn)業(yè)發(fā)展基礎(chǔ)設(shè)施的代名詞。大模型在學(xué)術(shù)界有時又被翻譯為基礎(chǔ)模型(Foundation Model),是指經(jīng)過預(yù)訓(xùn)練而得并能夠在多種下游任務(wù)中發(fā)揮基礎(chǔ)作用的模型。[1]例如,代碼基礎(chǔ)模型經(jīng)過少量下游任務(wù)提示就可以用于代碼生成、改寫、檢測、推薦、搜索等任務(wù)。由此可見,大模型發(fā)展趨勢之一就是成為人工智能產(chǎn)業(yè)發(fā)展的重要基礎(chǔ)設(shè)施。

從功用來看,大模型往往被用作海量知識的容器、模擬人類心智能力的認知引擎、驅(qū)動智能體與環(huán)境交互的大腦、協(xié)同不同組件與工具的操作系統(tǒng)、人機自然交互的接口。傳統(tǒng)AI解決問題需要面向特定任務(wù)進行針對性的模型研發(fā),而當(dāng)前這一范式讓位于基于統(tǒng)一大模型進行任務(wù)微調(diào)或者指令指引的新范式。大模型的功用與應(yīng)用范式?jīng)Q定了其在智能系統(tǒng)架構(gòu)中日益下沉為整個架構(gòu)的基礎(chǔ),不僅支撐著豐富多樣的上層應(yīng)用,也支撐著復(fù)雜意圖的理解與用戶需求的滿足。[2]近期打響的價格戰(zhàn)也從側(cè)面展現(xiàn)了大模型的基礎(chǔ)設(shè)施地位,唯有基礎(chǔ)設(shè)施才需要以持續(xù)走低的價格鎖定海量的忠實用戶,而只有持續(xù)增長的用戶和規(guī)模化應(yīng)用才能有效分攤大模型巨大的前期研制成本。

大模型成為新質(zhì)生產(chǎn)力的代表。大模型是AGI最重要的技術(shù)形態(tài)之一,是一種先進生產(chǎn)力,也可以說是新質(zhì)生產(chǎn)力的代表。勞動力是生產(chǎn)力諸要素中起決定性作用的要素,只有勞動力才能支配與使用其他生產(chǎn)要素(土地、資本、數(shù)據(jù)等)。大模型驅(qū)動的數(shù)字與機器員工將成為新型勞動力,這是大模型作為先進生產(chǎn)力的本質(zhì),人類迎來了可以與人類勞動力媲美的新型勞動力。AGI旨在達到或接近人類智力,一旦相關(guān)技術(shù)成熟,AGI驅(qū)動的智能機器,包括有形的機器勞動力和虛擬的數(shù)字勞動力等,將成為人類勞動力的重要補充。而機器和數(shù)字勞動力在可靠性、可用性以及對復(fù)雜與惡劣環(huán)境的適應(yīng)性等很多方面具有相較于人類勞動力的巨大優(yōu)勢。

從某種程度上說,以生成式大模型為代表的AGI將可能成為超越人類的先進勞動力。語言大模型一定程度上再現(xiàn)了人類的言說能力、寫作能力以及基于語言的邏輯表達與情感表達能力。多模態(tài)大模型能夠進一步完成多模態(tài)內(nèi)容的生成任務(wù),甚至實現(xiàn)了復(fù)雜世界的建模。具身大模型則側(cè)重于使智能機器具備規(guī)劃能力與理解復(fù)雜環(huán)境及進行自適應(yīng)交互的能力,機器操控各類工具完成復(fù)雜任務(wù)成為現(xiàn)實。[3]各種科學(xué)大模型、專業(yè)大模型則專注于具體科學(xué)任務(wù),使得專業(yè)性工作提質(zhì)增效,比如蛋白質(zhì)結(jié)構(gòu)大模型使得蛋白質(zhì)結(jié)構(gòu)預(yù)測效率得到極大提升。最近OpenAI推出的GPT-4o更是將機器的自然交互水平推向了新高度,機器已經(jīng)能在多人對話場景中實時理解人類的語音、姿態(tài)、情緒、意圖,具備了一定的認知人類社會的能力。單單就GPT-4o所展現(xiàn)出的能力可以預(yù)見,未來涉及人類情感交流的諸多行業(yè),比如教培、護理、心理咨詢等都將被AI賦能。[4]從腦力代替到體力代替、從文案生成到問題求解、從事實檢索到邏輯推理,可以說大模型正在全面進入人類智力的領(lǐng)地,除了自我意識等少部分人類自身也未能準確定義與理解的問題外,但凡能夠精準描述、刻畫、定義的大多數(shù)人類能力在不遠的將來都可能被大模型掌握。

值得注意的是,即便AI勞動力再先進,我們也必須堅持構(gòu)建人機協(xié)作的和諧人機關(guān)系。一方面,生成式AI短期內(nèi)仍將存在包括幻覺問題、過度能耗在內(nèi)的諸多局限,其生成過程與結(jié)果仍然需要人類的提示、控制與評判。另一方面,為推動實現(xiàn)人機和諧共處,人類不應(yīng)放棄決策自主權(quán),即便未來機器能夠在某項任務(wù)中代替人類,人類仍然應(yīng)該掌握最終的確認與決策權(quán),這也是人類應(yīng)該積極承擔(dān)和難以免除的責(zé)任。從短期來看,機器還難以被視作責(zé)任主體,“機器協(xié)作+人類決策”仍將是人機混合的勞動力市場的基本形態(tài)。從中長期來看,我們需要重新梳理人類的責(zé)權(quán)體系,機器有可能成為非關(guān)鍵責(zé)任主體或部分責(zé)任主體,在此過程中,我們要警惕人類推卸責(zé)任的傾向。

數(shù)據(jù)將成為大模型發(fā)展的決定性要素。大模型工程的本質(zhì)是數(shù)據(jù)工程,數(shù)據(jù)決定了大模型的落地效果。大模型的預(yù)訓(xùn)練、指令微調(diào)、價值對齊、評估評測等都依賴高質(zhì)量數(shù)據(jù)。當(dāng)前的研究與實踐證明高質(zhì)量數(shù)據(jù)是決定大模型性能與效果的關(guān)鍵因素,甚至是決定性因素。而大模型訓(xùn)練過程中的數(shù)據(jù)合成、數(shù)據(jù)配比、數(shù)據(jù)治理也能決定大模型的訓(xùn)練效果。[5]總體而言,高質(zhì)量數(shù)據(jù)以及高水平的數(shù)據(jù)工程方法是大模型發(fā)展的關(guān)鍵。此外,數(shù)據(jù)規(guī)模與復(fù)雜性會隨著人類社會的發(fā)展而增長。換言之,伴隨著技術(shù)進步與社會發(fā)展,數(shù)據(jù)的規(guī)模只會不斷創(chuàng)造新的記錄,數(shù)據(jù)的多樣性只會提升,而數(shù)據(jù)給技術(shù)帶來的挑戰(zhàn)也會進一步增加。隨著人才、算力等瓶頸被進一步突破,數(shù)據(jù)可能成為大模型發(fā)展的長期性、根本性、戰(zhàn)略性問題,甚至可能成為AGI發(fā)展的最大制約。

具體而言,一方面,構(gòu)建面向大模型的優(yōu)質(zhì)數(shù)據(jù)集仍需付出較大代價。訓(xùn)練語料、優(yōu)質(zhì)指令、評測數(shù)據(jù)總體上呈現(xiàn)一種分散狀態(tài),需要通過匯聚、清洗、去重、合成、篩選才能夠成為訓(xùn)練大模型的優(yōu)質(zhì)語料、指令與評測數(shù)據(jù)。[6]大模型總體上呈現(xiàn)出對于高質(zhì)量數(shù)據(jù)的“饑渴”狀態(tài),近期大模型產(chǎn)業(yè)發(fā)展的一些新動向多多少少都與搶占數(shù)據(jù)有關(guān)。例如,有傳統(tǒng)媒體狀告Google等企業(yè)在未經(jīng)授權(quán)的情況下使用媒體數(shù)據(jù)進行模型訓(xùn)練,以及OpenAI與Quora(國際版知乎)深度合作、OpenAI與蘋果智能深度合作,上述動向本質(zhì)上都是大模型頭部企業(yè)尋求優(yōu)質(zhì)數(shù)據(jù)的努力,表現(xiàn)出大模型產(chǎn)業(yè)發(fā)展對媒體數(shù)據(jù)、高質(zhì)量社區(qū)問答數(shù)據(jù)甚至個人數(shù)據(jù)的渴求。[7]另一方面,數(shù)據(jù)供應(yīng)不暢、數(shù)據(jù)治理能力薄弱等,都是大模型向縱深發(fā)展的限制性因素。從長期來講,數(shù)據(jù)問題的緩解需要數(shù)據(jù)要素市場的充分發(fā)展,當(dāng)下數(shù)據(jù)交易的一個重要動力就是構(gòu)建高質(zhì)量的行業(yè)大模型訓(xùn)練語料。但數(shù)據(jù)要素市場目前仍處于發(fā)展與完善進程中,其制度和基礎(chǔ)設(shè)施建設(shè)不僅需要時間,也需要大量實踐的反饋與優(yōu)化。此外,隨著大模型的進一步發(fā)展,其與千行百業(yè)的深度融合成為趨勢。在這一進程中,高質(zhì)量、高價值行業(yè)數(shù)據(jù)的價值更加凸顯,決定了大模型在各行業(yè)中的應(yīng)用效果。目前,行業(yè)數(shù)據(jù)對于大模型能力的價值還未得到充分釋放,這是大模型賦能高價值行業(yè)之前必須解決的重大問題。可以說,數(shù)據(jù)是大模型競爭的決定性因素,而從根本上緩解數(shù)據(jù)對大模型發(fā)展的制約,需要持續(xù)性、系統(tǒng)性的努力。

大模型產(chǎn)業(yè)發(fā)展焦點從基礎(chǔ)模型走向應(yīng)用生態(tài)。當(dāng)大模型具備了人類智能的基本能力,如何用好大模型就成為了重點。值得強調(diào)的是,用好大模型絕不比研發(fā)大模型容易。事實上,自ChatGPT誕生至今,大模型并未給人類切實創(chuàng)造多少價值,這一窘狀不應(yīng)歸咎于大模型自身的不足,而應(yīng)該歸因于人類自身能力的不足,特別是大模型應(yīng)用水平的不足。大模型好比武俠小說中的利器,唯有強者才能駕馭這一利器,進而釋放其價值。大部分人對于大模型的應(yīng)用可能就僅限于閑聊、文字潤飾。大模型本質(zhì)上是智者的利器,換言之,只有洞悉大模型特性的知識精英或者行家里手才能將大模型的能力淋漓盡致地發(fā)揮出來。用好大模型本身就是個人、組織、國家未來的核心競爭力之一。

如果將大模型視作一種電能,那么圍繞大模型打造的應(yīng)用就好比電器,形式多樣的電器是電能賦能千家萬戶的最終形態(tài)。我們不能否認發(fā)電的價值,但更應(yīng)該肯定電器制造的價值。圍繞大模型打造相關(guān)應(yīng)用,解決千行百業(yè)的痛點問題,將成為大模型產(chǎn)業(yè)未來發(fā)展的焦點。這決定了大模型下一階段發(fā)展的重點勢必是從通用走向?qū)S?,從開放走向私域,從基礎(chǔ)模型走向應(yīng)用生態(tài)。大模型能否解決金融決策輔助、醫(yī)療決策輔助、生產(chǎn)流程優(yōu)化、質(zhì)量提升、風(fēng)險管控等問題,決定了其價值密度。一旦大模型能在千行百業(yè)發(fā)揮作用,將釋放更大的產(chǎn)業(yè)能級。

大模型的應(yīng)用生態(tài)百花齊放,其中以下四類應(yīng)用尤為值得注意。一是硬件終端的智能升級。大模型賦能各種終端是正在發(fā)生的一個重大產(chǎn)業(yè)趨勢,PC、音箱、家電、手機、手表、智能車等都將被大模型賦能,而大模型將借助這些硬件載體為人類帶來更強大的意圖理解、更自然的人機交互、更細致的任務(wù)規(guī)劃以及更精準的信息服務(wù)。二是個人消費服務(wù)的智能升級。購物、出行、游戲、文化、教育、健康等涉及個人服務(wù)的場景將被大模型顯著賦能,比如大模型驅(qū)動游戲中的NPC(Non-Player Character),能夠顯著提升NPC的智能水平,提升游戲玩家體驗;英語外教等教培行業(yè)也正在被大模型重塑。三是企業(yè)信息服務(wù)的智能升級。大模型對于推動企業(yè)數(shù)字化轉(zhuǎn)型具有革命性意義。在大模型驅(qū)動下,企業(yè)經(jīng)營管理和決策過程將發(fā)生根本性、革命性的升級,大模型將在傳統(tǒng)企業(yè)運營流程中扮演重要角色,代替人類專家、小模型以及專家系統(tǒng),完成流程中的諸多環(huán)節(jié)。此外,大模型對于開放世界的理解能力有助于提高企業(yè)數(shù)字化解決方案對于市場變化的響應(yīng)效率,增強系統(tǒng)的敏捷應(yīng)對能力。四是行業(yè)智能化應(yīng)用。行業(yè)應(yīng)用的本質(zhì)是認知決策,大模型豐富的知識儲備和強大的認知能力使其能在各行各業(yè)的商務(wù)決策過程中扮演重要輔助角色,如金融市場決策、醫(yī)療診斷決策等。同時,大模型將成為人類專家的決策助手,拓展專家的認知范圍,提供更多的決策變量、方案選擇和決策路徑指引,提示潛在風(fēng)險,對人類方案提出優(yōu)化建議等等。

大模型發(fā)展的新舉措

針對大模型產(chǎn)業(yè)發(fā)展呈現(xiàn)出的新態(tài)勢、新動向,我們要樹立大模型發(fā)展的全局觀和整體觀,提前研判、積極應(yīng)對。大模型產(chǎn)業(yè)發(fā)展涉及要素眾多,不能僅從大模型自身發(fā)展的核心要素進行思考。一方面,要統(tǒng)籌考慮大模型與數(shù)據(jù)要素市場發(fā)展;另一方面,要將大模型置于推動我國各行業(yè)轉(zhuǎn)型升級、高質(zhì)量發(fā)展,全面深化改革以及解決或緩解當(dāng)前我國經(jīng)濟社會發(fā)展中諸多問題的重要科技引擎的新角色中進行思考;此外,更要從大模型作為一種先進生產(chǎn)力對生產(chǎn)關(guān)系、人類發(fā)展、社會發(fā)展的影響等宏觀角度進行思考。

加快人工智能教育體系的建設(shè)。如果有人問,人類為迎接即將到來的AI技術(shù)革命所需要開展的第一項工作是什么?筆者認為答案應(yīng)是教育變革。AI作為一種先進生產(chǎn)力,它的發(fā)展勢必要求生產(chǎn)關(guān)系與之相適應(yīng)。生產(chǎn)關(guān)系的調(diào)整過程涉及整個社會諸要素的調(diào)整,涉及因素眾多,其中最基礎(chǔ)、最首要的一環(huán)就是教育。為在大模型國際競爭賽道上搶占先機,我們必須培養(yǎng)大量人工智能專業(yè)技術(shù)人才,具體而言,不僅需要培養(yǎng)跨行業(yè)融合的AI人才,以將AI技術(shù)應(yīng)用于千行百業(yè);還需要培養(yǎng)跨學(xué)科的AI人才,以重塑人文社科的學(xué)科內(nèi)涵,加速自然科學(xué)的知識發(fā)現(xiàn)進程。此外,我們還需要提升全體國民的AI素養(yǎng),使AI技術(shù)像電腦與互聯(lián)網(wǎng)一樣得到廣泛應(yīng)用,唯有如此,AI才有可能成為全社會發(fā)展的引擎。

在AGI時代即將全面到來之際,教育本身的內(nèi)涵需要重塑。教師教什么?學(xué)生學(xué)什么?教育管什么?這些問題都需要重新回答?,F(xiàn)代文明所追求的知識發(fā)現(xiàn)與獲取能力或?qū)⒅鸩酵嗜ス猸h(huán),生存與發(fā)展的智慧將更具價值。除了作為現(xiàn)代文明人所必要的核心素養(yǎng)與能力之外,審美、判斷、鑒賞、提問、批判能力將更加重要。事實的記憶、繁瑣的運算、常規(guī)內(nèi)容的生成,基本上都可以交給人工智能。在未來AGI大發(fā)展時代,如何駕馭與使用AI將成為人類最有價值的技能之一。然而,隨著AGI的日益復(fù)雜及其能力的增長,認知并駕馭AI也將愈加困難,AI教育的使命日益艱巨。

推動AI教育的首要任務(wù)在于確立AI技術(shù)在教育中安全應(yīng)用的基本原則。當(dāng)前,很多組織和高校都在積極推動AI教育,各國政府也紛紛發(fā)出了AI與教育深度融合的呼聲,這對推動AI技術(shù)在教育教學(xué)中的普及與應(yīng)用有著積極的意義。然而,我們要尤為注意的是,AI在教育中的應(yīng)用需“有所為、有所不為”,而不能越界,否則將可能違背教育的初衷。對于AI在教育中的應(yīng)用,需仔細甄別其對于學(xué)習(xí)者自身能力的習(xí)得是有利還是有弊,而不能不加選擇地盲目濫用。試想一下,如果一個仍在學(xué)習(xí)寫作的小學(xué)生使用AIGC(Aritificial Intelligence Generated Content,生成式人工智能)進行作文輔助,如果學(xué)生在做每一道數(shù)學(xué)題之前都先去問問AI,那么學(xué)生們的寫作與計算能力如何才能形成呢?與此相反,教師、家長利用AGI進行備課、輔導(dǎo)卻是十分有益的。由此可見,AI技術(shù)在教育中的應(yīng)用需具體問題具體分析,其中針對學(xué)習(xí)者的AI應(yīng)用應(yīng)該極為謹慎,否則可能事與愿違。

學(xué)習(xí)者是否應(yīng)該使用AI,如何使用AI?解決此類問題需要十分細致而繁瑣的甄別工作。其基本原則在于,在學(xué)習(xí)者的某項核心能力形成之前,應(yīng)該謹慎借助AI的此項能力。因此,對學(xué)習(xí)者的能力進行精準刻畫,進而進行分級分類的AI應(yīng)用管控是促進學(xué)習(xí)者更好利用AI的基本思路,除此之外的其他分類依據(jù)都存在一定的不合理之處。例如,有觀點認為大學(xué)生可以肆無忌憚地使用AI,這樣的分類原則顯然過于武斷了,比如對于一個第一次學(xué)習(xí)日語的日語系新生而言,他/她完全是日語語言習(xí)得的門外漢,而對AI的濫用可能導(dǎo)致其永遠也無法習(xí)得日語言說的能力。

建立以智能科學(xué)為核心的跨學(xué)科研究體系。學(xué)科劃分使得人類對于客觀世界和人類社會的有限經(jīng)驗與理性思考逐漸走向?qū)iT化、專業(yè)化,也在一定程度上造成了人類對世界統(tǒng)一性、整體性認知被分解。部分細分學(xué)科內(nèi)部同質(zhì)化研究泛濫,原始創(chuàng)新動力不足,未來最為重要的任務(wù)在于重建關(guān)于世界本原的整體性認知。

AGI擁有不同學(xué)科知識,為人類的跨學(xué)科認知進而整體性把握世界帶來了重大機遇。大模型通過通用語料訓(xùn)練習(xí)得了不同學(xué)科的知識,同時具備了一定的組合創(chuàng)新能力,因而擅長將不同學(xué)科的知識進行組合以解決問題。大模型的跨學(xué)科知識將是協(xié)助人類開展跨學(xué)科融合研究的利器。對于人文社科而言,AI帶來的絕不僅僅是工具的革新,而是重塑傳統(tǒng)人文社科的一次重大機遇。人工智能通過實現(xiàn)一個無限接近于人的智能體,在不斷追問人的本質(zhì)、智能的本質(zhì)、自我的本質(zhì),而實現(xiàn)本身就是一種理解。AI的快速進步需要我們重塑理解“人與社會”的既有概念與理論框架。從本質(zhì)上來講,認知人文社會現(xiàn)象的隱喻對象發(fā)生了根本變化,從傳統(tǒng)的動物轉(zhuǎn)變成了智能機器。智能機器通過不同于人類的機制甚至實現(xiàn)了很多超越人的根本特性,這就可能從根基上撼動現(xiàn)有人文社科的理論框架。同時,AGI也呈現(xiàn)出強大的世界建模能力,以Sora為代表的大模型建模能力達到了新的高度。從一定意義上說,對于某個特定現(xiàn)象的重建能力就可以被視作一種理解能力,AI一旦具備世界建模能力,其對世界認知的廣度與深度就可能超越人類,AI對世界本原的認知也就有可能超越人類的現(xiàn)有認知。未來科學(xué)研究的重大任務(wù)之一就是借助AGI對復(fù)雜世界的編碼與建模能力,重建對于世界本原的認知。

跨學(xué)科研究另一個方向的重要使命在于“為機器立心、為智能立命”。加深對于AGI本身的認知,建立理解AGI的概念框架,是推動AGI進一步發(fā)展以及幫助人類更好地駕馭與管控AGI的根本所在。人工智能以人類智能為拓版,而今卻日益呈現(xiàn)出其專有特性。幾千年來,人類已經(jīng)建立起的對于人以及由人所構(gòu)成社會的認知體系與理論框架,這是我們理解AI的心智以及智能體社會的有益參考。至少可以說,以人類為模板去理解AI是理解AI的第一步。隨著AGI日益融入人類生活,如何理解與控制AI個體以及群體的心智、角色、行為,是實現(xiàn)AI安全可控的關(guān)鍵,是促使AI造福人類而不致危害人類的關(guān)鍵。為AI“立心立命”,讓AI守規(guī)守矩,是智能時代到來之前我們需要做好充分應(yīng)對準備的難題之一。

加速數(shù)據(jù)要素市場發(fā)展,推動大模型與數(shù)據(jù)要素的協(xié)同發(fā)展。大模型產(chǎn)業(yè)進一步發(fā)展對高質(zhì)量數(shù)據(jù)的需求更為迫切,大模型與數(shù)據(jù)要素的發(fā)展日益融合,二者協(xié)同發(fā)展勢在必行。第一,大模型有望成為激活數(shù)據(jù)要素價值的智能引擎。以生成式大語言模型為代表,大模型已具備強大的世界建模能力、數(shù)據(jù)認知與操控能力,這將促使其成為激活數(shù)據(jù)要素價值、實現(xiàn)數(shù)據(jù)要素累乘效應(yīng)的智能引擎。大模型與數(shù)據(jù)要素的融合發(fā)展,有望賦能千行百業(yè)成為數(shù)據(jù)價值變現(xiàn)的重要方式。第二,大模型將為緩解數(shù)據(jù)治理技術(shù)瓶頸帶來新的機遇。數(shù)據(jù)治理代價大、成本高,已經(jīng)成為數(shù)據(jù)要素價值變現(xiàn)的堵點與痛點。大模型有著強大的開放數(shù)據(jù)的理解和操控能力,因而有望利用大模型等人工智能技術(shù)手段構(gòu)建智能化數(shù)據(jù)治理體系,進而實現(xiàn)自動化、智能化數(shù)據(jù)治理,減少治理過程對人力的依賴。第三,基于大模型智能體技術(shù)有望打造貫穿數(shù)據(jù)價值變現(xiàn)流程的數(shù)據(jù)挖掘、分析、操控智能體,全面提升數(shù)據(jù)要素價值變現(xiàn)的效率。大模型對于數(shù)據(jù)、數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)處理過程的理解與操控能力,使其可能成為釋放數(shù)據(jù)要素價值的數(shù)據(jù)智能體。第四,圍繞大模型行業(yè)語料所形成的高價值數(shù)據(jù)產(chǎn)品可以檢驗數(shù)據(jù)要素市場機制。目前,數(shù)據(jù)要素市場中仍然缺乏商業(yè)價值明確、交易機制清晰、安全可靠合規(guī)的數(shù)據(jù)產(chǎn)品。相較于其他涉及國計民生的數(shù)據(jù)產(chǎn)品,大模型訓(xùn)練語料接近教學(xué)科普類書籍的內(nèi)容,與個人隱私、行業(yè)安全關(guān)聯(lián)不大,其交易相對安全、可靠、合規(guī),因而容易形成高價值的數(shù)據(jù)產(chǎn)品,進而檢驗我國數(shù)據(jù)要素市場制度建設(shè)和基礎(chǔ)設(shè)施建設(shè)的合理性。

數(shù)據(jù)要素市場的進一步健全、數(shù)據(jù)要素技術(shù)的進一步完善,也將為大模型的發(fā)展注入強勁動力。首先,數(shù)據(jù)要素市場為大模型的數(shù)據(jù)集提供了合法合規(guī)的獲取渠道與機制。通過數(shù)據(jù)產(chǎn)品的合規(guī)交易,各行業(yè)大模型訓(xùn)練所需要的高質(zhì)量訓(xùn)練語料有望得以匯集,從而緩解大模型在行業(yè)落地過程中對于高質(zhì)量數(shù)據(jù)的“饑渴”狀態(tài)。其次,強大的數(shù)據(jù)合成與治理能力可以用于進一步提升大模型訓(xùn)練語料、指令數(shù)據(jù)的質(zhì)量與規(guī)模。面向大模型訓(xùn)練的語料集建設(shè)、指令集構(gòu)建、價值對齊數(shù)據(jù)構(gòu)建等都對數(shù)據(jù)治理、數(shù)據(jù)處理、數(shù)據(jù)合成等技術(shù)提出了較高要求,而大模型驅(qū)動的智能化的數(shù)據(jù)能力體系能夠滿足相應(yīng)要求。

堅持多元化的大模型發(fā)展路徑。以大模型為代表的AGI形態(tài)與發(fā)展路徑是多種多樣的,為此應(yīng)堅持多元化的發(fā)展戰(zhàn)略。從參數(shù)規(guī)模角度來看,大模型會向越來越大和越來越小兩個方向同時發(fā)展。當(dāng)前,大模型發(fā)展的一個重要趨勢是參數(shù)量越來越大,主流參數(shù)在十億、百億到千億級,不同參數(shù)規(guī)模有著不同的智能潛能,適合不同的應(yīng)用場景。大模型的能力隨著參數(shù)規(guī)模、訓(xùn)練數(shù)據(jù)和訓(xùn)練時間的增加而持續(xù)增長。增大模型參數(shù)量仍是探索機器智能極限的重要方式之一,而更大參數(shù)的模型也是進一步發(fā)揮大模型的標(biāo)度律(scaling law)效應(yīng)的方式之一。[8]值得深思的問題是,大模型發(fā)展到終極狀態(tài),標(biāo)度律是否仍然成立。換言之,大模型的能力提升是否存在天花板,也就是說再多的數(shù)據(jù)、再多的訓(xùn)練、再多的參數(shù)也不再能提升大模型的能力。提出這個問題的理由是充分的,一方面,大模型訓(xùn)練正在迅速耗盡人類的優(yōu)質(zhì)數(shù)據(jù);另一方面,能源消耗存在天花板,人類社會的能源開發(fā)和利用仍然存在制約,因而人類不可能無限、單向度地向大模型供給能源。此外,歷史上任何技術(shù)發(fā)展曲線最終都會遭遇天花板。由此,對大模型的標(biāo)度律進行質(zhì)疑是合理且充分的。

但是,以大模型為代表的AGI也呈現(xiàn)出自我提升與自我完善的可能性。這與人類相似,人類一直在追求并實現(xiàn)對于前代的超越,上升似乎是人類水平的智能族群的基本特征之一。那么,當(dāng)AGI達到或超越人類智能水平之后,同樣有著充分的理由推斷AGI可能實現(xiàn)持續(xù)上升從而保持標(biāo)度律持續(xù)有效。因此,對于AGI天花板是否存在這一問題,保持一種謹慎而開放的態(tài)度是合適且必要的。然而,當(dāng)前一些現(xiàn)實因素可能會制約大模型能力的進一步增長。首先,優(yōu)質(zhì)數(shù)據(jù)生產(chǎn)速度可能遠遠跟不上大模型學(xué)習(xí)數(shù)據(jù)的速度;其次,人類新能源開發(fā)與利用的效率難以滿足大模型能源消耗的需求。[9]因此,筆者傾向于認為大模型的能力最終會進入一個或至少會保持一段時間的徘徊期。在這個徘徊期內(nèi),大模型會隨著所學(xué)習(xí)數(shù)據(jù)的增多,持續(xù)拓展其認知的事實與知識邊界,但是決定其智商與情商的核心能力,如思維能力、邏輯能力、推理能力以及與人類共情的能力的發(fā)展可能會遭遇天花板??档略?jīng)將人類的智能分為知性與理性,所謂知性是指感性而雜多的事實性知識,而理性則是一種將這些雜多的知識進行有序組織的能力。套用康德的分類,筆者傾向于認為大模型所代表的AI在知性方面將仍然遵守標(biāo)度律,但在理性方面則將遭遇天花板。

如果說更大規(guī)模參數(shù)的大模型是在幫我們探索智能的極限,那么更加小型而實用化的模型則是夯實AGI現(xiàn)實應(yīng)用的基礎(chǔ)。大模型的小型化是推動大模型在更加泛在的低端硬件和邊緣環(huán)境應(yīng)用落地的必然舉措。大模型的小型化從表面上看是大模型的瘦身,涉及大模型的蒸餾機制,[10]但是從本質(zhì)來看,其涉及的是大模型可解釋機理等根本問題。[11]如果將大模型類比于人類大腦的神經(jīng)網(wǎng)絡(luò),那么與人腦類似,至今對人類諸多能力的實現(xiàn)與表達是分布式還是集中式(抑或是宏觀上集中,微觀上分布),仍存在爭議。對于“祖母”細胞是否在大腦中存在這一問題,理解之關(guān)鍵在于確證大腦神經(jīng)元是否存在特定區(qū)域完成特定功能的傾向,事實上,一些解剖學(xué)研究成果證明大腦存在一定的功能區(qū)域,比如人腦的海馬體為人類提供認知地圖的能力。目前,大模型是否也存在著類似的功能分區(qū)(或者說相對集中)仍然不得而知,一定程度上,剖析大模型并不比剖析人腦的神經(jīng)網(wǎng)絡(luò)更為簡單。唯有從源頭上厘清大模型的參數(shù)分布與模型能力之間的因果關(guān)系,才能從根本上響應(yīng)大模型的小型化等應(yīng)用訴求。

AI智能體重塑社會關(guān)系與行業(yè)發(fā)展形態(tài),塑造社會科學(xué)新內(nèi)涵。大模型的應(yīng)用普及將重塑各行各業(yè)的發(fā)展形態(tài),人類社會甚至存在被AI代理全面接盤的可能。以內(nèi)容生產(chǎn)與傳播行業(yè)為例,AIGC提高了內(nèi)容創(chuàng)作效率,內(nèi)容與信息呈泛濫之勢,普通人已經(jīng)無法完全閱讀仍在快速增長的新聞,科學(xué)家也無法盡閱每天生產(chǎn)的海量文獻。作為生物智能的人類的有限認知能力使其淹沒于內(nèi)容海洋,對世界準確的整體性理解越發(fā)困難。而破題的關(guān)鍵仍然在于用好AI,讓AI成為每個個人的數(shù)字分身,完整復(fù)制每個個體的價值與情感偏好,使其成為我們的內(nèi)容生產(chǎn)與消費的忠實代理。未來,AI生成的泛濫必然催生內(nèi)容生產(chǎn)和消費的AI代理模式。內(nèi)容生成將由人類授意的AI代理智能體完成,內(nèi)容的閱讀與消費同樣由人類的AI代理完成。這些AI代理將協(xié)助人類完成內(nèi)容的生產(chǎn)、分發(fā)、篩選、傳播與消費。

一個數(shù)字分身或者智能代理泛濫的時代又會是個怎樣的時代呢?這是個更加值得深入思考的問題。你的數(shù)字分身或者AI代理在多大程度上能夠行使你的主體意志,每個個體又在多大程度上能夠讓渡主體意志給AI呢?未來社會可能將日益演變成人類及其AI代理構(gòu)成的社會,人與人的關(guān)系已經(jīng)無法完整地定義社會關(guān)系,人與自己的AI代理、AI代理與AI代理,成為了社會關(guān)系的必要構(gòu)成。社會科學(xué)的全部內(nèi)涵因此而被刷新,重建我們的社會科學(xué)成為新的歷史使命。AI智能體社會的到來,勢必要求重新建構(gòu)人類的倫理框架、道德體系、情感框架,構(gòu)建和諧的人機關(guān)系將成為社會關(guān)系發(fā)展的重要目標(biāo)之一,而不單單是人與人的關(guān)系。

AI代理參與的社會也將重塑人類的生活方式和行業(yè)業(yè)態(tài)。比如,出于功能性的消費活動完全可以由AI代理完成,人類消費的真正價值可能僅在于情感體驗,如精挑細選的樂趣,而不再是買到商品這一樸素目的。從這個意義上來講,購物的功能性內(nèi)涵將消失。再比如內(nèi)容生產(chǎn)與傳播行業(yè),如果AI代理將代替人類成為內(nèi)容生產(chǎn)與傳播的主要受眾或?qū)ο螅敲磦鹘y(tǒng)的面向人的圖書編輯與出版、新聞內(nèi)容的生成與傳播將何去何從?一定程度上可以說,幾乎所有的行業(yè)都要正視一個新的事實:服務(wù)對象從人變成人的AI代理,而這一變化勢必要求重塑傳統(tǒng)行業(yè)形態(tài)。

大模型發(fā)展過程中的風(fēng)險管控

作為一種先進技術(shù),大模型具有兩面性,運用得當(dāng)將成為先進生產(chǎn)力,但運用不當(dāng)也可能成為巨大破壞力。安全可控必須是發(fā)展大模型的前提,為此,我們必須未雨綢繆,對未來大模型的大規(guī)模應(yīng)用所帶來的諸多負面問題做好提前研判與積極準備,從全局考慮AI應(yīng)用問題,不能唯生產(chǎn)力論AI,而應(yīng)兼顧AI應(yīng)用所帶來的方方面面影響,并深入研判AI應(yīng)用的長期影響。

加大大模型風(fēng)險管控力度,加強大模型合規(guī)應(yīng)用的制度建設(shè)。大模型會對人類社會的哪些方面產(chǎn)生影響?這種提問已不合時宜。其相反的問題更有價值,即人類社會的哪些方面不會受到大模型影響?答案可能是“并不多”,大模型對人類社會的影響是廣泛而深遠的。人類社會方方面面的發(fā)展都需要運用人類的智力,而但凡人類智識所及之處皆可為大模型用武之地。正是基于這個原因,大模型的負面影響,更加值得我們高度關(guān)注。

隨著大模型的普及應(yīng)用,其所帶來的負面問題日益顯現(xiàn),如虛假內(nèi)容泛濫、價值觀偏差、侵犯版權(quán)、隱私泄露、人群偏見、新型信息繭房等。其一是大模型驅(qū)動的AIGC技術(shù)使得內(nèi)容生成與制作的門檻大大降低,虛假內(nèi)容呈現(xiàn)泛濫態(tài)勢。[12]傳媒生態(tài)所賴以存在的信息真實性前提受到前所未有的挑戰(zhàn)。其二是大模型存在暴露偏差等問題,即大模型訓(xùn)練語料可能存在各種偏差與傾向,比如種族偏見、性別偏見、文化偏見、意識形態(tài)偏見。[13]其三是大模型給版權(quán)保護帶來了前所未有的挑戰(zhàn)。一方面,大模型廠商可能在未經(jīng)授權(quán)的情況下使用版權(quán)所有者的數(shù)據(jù)進行訓(xùn)練。另一方面,大模型的使用者可能使用大模型生成的內(nèi)容作為自主知識產(chǎn)權(quán)的內(nèi)容。由此可見,大模型給傳統(tǒng)知識產(chǎn)權(quán)概念框架與實踐操作均帶來了重大挑戰(zhàn)。[14]其四是大模型訓(xùn)練數(shù)據(jù)對用戶隱私的侵犯,進而對傳統(tǒng)的隱私框架提出了新要求。例如一個教授在學(xué)校網(wǎng)站上公開了自己的聯(lián)系方式,但這并不意味著該教授希望自己的聯(lián)系方式被大模型習(xí)得而為所有人認知。[15]其五是新型信息繭房的形成,隨著大模型日益成為各類互聯(lián)網(wǎng)信息系統(tǒng)的新基座,信息消費者的認知將難以掙脫由大模型所編織的新型信息繭房[16]。這些隨大模型普及應(yīng)用而正在逐漸顯現(xiàn)的問題都需要有關(guān)部門加強研究,加大大模型風(fēng)險管控力度,加快大模型合規(guī)應(yīng)用的制度建設(shè)。

AI大規(guī)模濫用對人類自身發(fā)展帶來的長期負面影響。顯性的負面影響容易覺察,但更為致命的則是不易覺察的問題。因此,我們更需要高度警惕AI(特別是AGI技術(shù))大規(guī)模濫用帶來的隱性、長期的負面影響。所謂AI濫用是指過度地、不加限制地使用AI技術(shù),這種濫用往往出于眼前的或者短期巨大利益的考量而有意無意忽視AI發(fā)展的長期問題,最終對人類福祉或者特定群體利益造成長期的難以彌補的侵害。AI濫用往往有著溫和甚至是極具吸引力的外表,如果在推動AI成為先進生產(chǎn)力的過程中對AI的應(yīng)用不加以區(qū)分與選擇,對AI的負面問題視而不見,久而久之,AI濫用會像溫水煮青蛙一般以一種緩慢而難以察覺的進程給人類帶來難以挽回的傷害。鑒于此,我們需高度警惕AI的濫用問題,認識到AI應(yīng)用應(yīng)該“有所為、有所不為”,盡快為AI的安全應(yīng)用設(shè)立基本原則。

從本質(zhì)上看,大規(guī)模AI的長期濫用可能會帶來人之為人的本性倒退。技術(shù)的每一次進步都可能帶來人類某種能力的倒退,例如輸入法技術(shù)的進步帶來的是很多人的提筆忘字。但是,當(dāng)達到人類智力水平的AGI大量代替人類腦力勞動時,隨之而來的可能的腦力倒退卻是人類難以承受的。具體而言,在個體具備某項能力之前(比如寫作),不加克制地濫用AI的相應(yīng)能力,將會阻礙個體獲得此項能力。因而即使計算機早就能代替人類進行計算,但是我們的兒童必須付諸艱苦的訓(xùn)練掌握基本的計算能力。我們必須警惕人類心智的核心能力因為AI的濫用而倒退,人類心智水平的倒退,勢必帶來主體意志的逐步消退,而AI對于人類主體意志的侵犯,將導(dǎo)致難以承受的后果。

由此可見,無論AI技術(shù)發(fā)展到何種水平,AI應(yīng)用都應(yīng)該以保障人性和人類智能的核心素養(yǎng)與能力的充分發(fā)展為前提。AI應(yīng)用應(yīng)該為人類智力、能力的訓(xùn)練與實踐留下充足的機會和空間,面向青少年的基礎(chǔ)教育階段恰恰是人類核心能力的形成時期,因而對于此階段的AI應(yīng)用應(yīng)高度謹慎。同時,人類社會的大部分工作崗位,都必須保留特定規(guī)模的人群從事相應(yīng)的手工工作,人類的所有技術(shù)應(yīng)該像非物質(zhì)文化遺產(chǎn)一樣,指定足夠規(guī)模的人類群體進行傳承和發(fā)展,而AI應(yīng)用應(yīng)該適當(dāng)“留白”。

生產(chǎn)關(guān)系、社會價值觀念、文化藝術(shù)創(chuàng)作等與AI生產(chǎn)力的適應(yīng)性問題。作為先進生產(chǎn)力,大模型對整個社會和各行各業(yè)進行全面滲透并產(chǎn)生革命性影響幾乎是不可避免的。這就要求關(guān)系到價值觀念、倫理體系、文化教育、生產(chǎn)關(guān)系等社會發(fā)展的方方面面都要作出積極變革和適應(yīng)性調(diào)整,才能適應(yīng)這種先進生產(chǎn)力的發(fā)展。

從短期來看,大模型等AGI技術(shù)將給就業(yè)市場帶來直接影響。AGI應(yīng)用的過程本質(zhì)上就是AI勞動力逐步代替人類勞動力的過程,在這個過程中,越來越多的任務(wù)、工作逐步交給了效率更高、效果更好的機器。而AI代替人類的過程必須是緩慢、漸進、有序的過程,以避免劇烈的就業(yè)結(jié)構(gòu)調(diào)整所帶來的社會震蕩。從更長時期的范圍來看,大規(guī)模AI應(yīng)用也可能影響現(xiàn)有的社會階層結(jié)構(gòu)。未來,因為AI智能水平參考線的存在,人類群體將可能被分為AI智識水平之上和之下兩大層次。對于人類個體而言,跨越AI的智識水平線將變得日趨困難。隨之可能帶來的階層固化甚至對立是需要正視的問題。此外,AI無節(jié)制地介入人類情感生活會讓人迷失于虛擬的情感世界、甚至產(chǎn)生畸形的情感依賴。人與人之間的真摯情感將可能被人機虛擬情感所干擾,進而引發(fā)人類情感混亂。

大規(guī)模AI應(yīng)用對人類思想、文化、藝術(shù)等方面產(chǎn)生的更長期的影響同樣值得注意。當(dāng)前,生成式人工智能已經(jīng)涉足音樂、繪畫、影視等幾乎一切人類的藝術(shù)創(chuàng)作形式。人類的生命是有限的,而即使人類生命延長似乎也無法趕上藝術(shù)品生產(chǎn)的速度,那么,人類在有限的生命里何以享受這過于豐盛的藝術(shù)盛宴。歷史上,人類從未像今天一樣面臨窘境:我們淹沒在審美的海洋中,試問,我們會不會因此而窒息呢?如果人類個體的一生都處于審美的高亢興奮體驗之中,這樣的人生又有怎樣的價值與意義呢?美之泛濫是否會消滅美的本身呢?生成式人工智能的泛濫將會打破美的稀缺性,而這可能進一步消弭審美需求,進而影響傳統(tǒng)藝術(shù)形式的發(fā)展。AI創(chuàng)作似乎正在快速窮盡藝術(shù)創(chuàng)作的組合空間,比如AI生成音樂可能很快窮舉我們所能感知的絕大部分曲調(diào),繼而危及音樂這種藝術(shù)形式的存在。

為使社會發(fā)展能夠以和諧的方式適應(yīng)人工智能這一先進生產(chǎn)力,我國應(yīng)充分發(fā)揮在統(tǒng)籌社會方面的制度優(yōu)勢,在生產(chǎn)關(guān)系調(diào)整、教育體系革新等方面作出富有前瞻性與建設(shè)性的系統(tǒng)謀劃,并積極、嚴密、細致地推進相應(yīng)的布局調(diào)整,避免出現(xiàn)劇烈沖擊和較大的震蕩。目前我國正處于全面深化改革的關(guān)鍵時期,進一步全面深化改革,要抓住主要矛盾和矛盾的主要方面,“進一步解放和發(fā)展社會生產(chǎn)力、增強社會活力,推動生產(chǎn)關(guān)系和生產(chǎn)力、上層建筑和經(jīng)濟基礎(chǔ)更好相適應(yīng)”[17]。推動以大模型為代表的AGI技術(shù)與生產(chǎn)關(guān)系、上層建筑更好地適應(yīng),無疑是踐行這一方針的具體措施之一。

結(jié)語

當(dāng)前,大模型發(fā)展日益呈現(xiàn)出與數(shù)據(jù)要素融合發(fā)展、其逐漸沉淀為基礎(chǔ)設(shè)施、發(fā)展焦點從底座模型轉(zhuǎn)移至應(yīng)用生態(tài)等新的趨勢。以大模型為代表的AGI將成為先進生產(chǎn)力的代表,我們在擁抱這一先進生產(chǎn)力的興奮之余,也要密切關(guān)注其濫用、誤用與惡用所帶來的負面問題。要以更為深入的思考、更加長遠的眼光、更加全面的梳理和更加精準的研判,做好全面、積極、主動的應(yīng)對,確保AI成為人類之福,而不是人類之禍。

在AGI快速發(fā)展的時代,如何打發(fā)閑暇時光,如何安置靈魂成為人類需要直面的問題。從表面上看這似乎是個幸福的煩惱,然而,筆者更愿意稱其為“戴著和善面具的惡魔”。未來,人類應(yīng)對AGI的利用加以適當(dāng)引導(dǎo)與控制。即便有AI的助力,以卓越精神仰望星空也仍需要付諸常人所不能想象的艱辛和長期堅持。

古代歐洲的貴族們往往都有貼心的管家?guī)椭淞侠砼c經(jīng)營生活,這成就了一批貴族精英代表人類專心致志、心無旁騖地探索未知世界,但更為常見的情形卻是養(yǎng)出了大批“好吃懶做、肥頭大耳”的精神侏儒。AGI日漸成為人類的貼心管家,AI代理人類社會似乎成為必然趨勢,而在這一過程中人類更應(yīng)奮發(fā)向上,借助AI力量去勤奮地探索未知世界,不斷開辟新的認知疆域。

注釋

[1]R. Bommasani, D. A. Hudson et al., “On the Opportunities and Risks of Foundation Models,“ arXiv preprint arXiv:2108.07258, 2021; A. Young, B. Chen, C. Li et al., “Yi: Open Foundation Models by 01.AI,“ arXiv preprint arXiv:2403.04652, 2024.

[2]X. Chen, L. Li, L. Chang et al., “Challenges and Contributing Factors in the Utilization of Large Language Models (LLMs),“ arXiv preprint arXiv:2310.13343, 2023.

[3]S. Pang, E. Nol, K. Heng, “ChatGPT-4o for English Language Teaching and Learning: Features, Applications, and Future Prospects,“ SSRN Electronic Journal, 2024; S. N. Wadekar, A. Chaurasia, A. Chadha et al., “The Evolution of Multimodal Model Architectures,“ arXiv preprint arXiv:2405.17927, 2024.

[4]S. Pang, E. Nol, K. Heng, “ChatGPT-4o for English Language Teaching and Learning: Features, Applications, and Future Prospects,“ SSRN Electronic Journal, 2024.

[5]D. Zhang, Y. Yu, C. Li et al., “MM-LLMs: Recent Advances in Multimodal Large Language Models,“ arXiv preprint arXiv:2401.13601, 2024.

[6]D. Zhang, Y. Yu, C. Li et al., “MM-LLMs: Recent Advances in Multimodal Large Language Models,“ arXiv preprint arXiv:2401.13601, 2024; Y. Liu, J. Cao, C. Liu et al., “Datasets for Large Language Models: A Comprehensive Survey,“ arXiv preprint arXiv:2402.18041, 2024.

[7]《7天內(nèi)2次收購!OpenAI豪擲重金接連吞并兩家初創(chuàng)》,2024年6月26日, https://www.thepaper.cn/newsDetail_forward_27859971;《違規(guī)使用新聞出版商數(shù)據(jù)訓(xùn)練大模型,谷歌在法被罰2.5億歐》,2024年3月26日, https://new.qq.com/rain/a/20240326A0A27N00。

[8]J. Kaplan, S. McCandlish, T. Henighan et al., “Scaling Laws for Neural Language Models,“ arXiv preprint arXiv:2001.08361, 2020.

[9]N. Muennighoff, A. Rush, B. Barak et al., “Scaling Data-Constrained Language Models,“ Advances in Neural Information Processing Systems, 2024, 36; Y. Liu, J. Cao, C. Liu et al., “Datasets for Large Language Models: A Comprehensive Survey,“ arXiv preprint arXiv:2402.18041, 2024.

[10]X. Xu, M. Li, C. Tao et al., “A Survey on Knowledge Distillation of Large Language Models,“ arXiv preprint arXiv:2402.13116, 2024.

[11]D. Chen, J. P. Mei, H. Zhang et al., “Knowledge Distillation with the Reused Teacher Classifier,“ 2022 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR), New Orleans, LA, USA, 2022.

[12]X. Li, Y. Zhang, E. C. Malthouse, “Large Language Model Agent for Fake News Detection,“ arXiv preprint arXiv:2405.01593, 2024;《又遭投訴!Meta因利用用戶數(shù)據(jù)訓(xùn)練人工智能模型遭挪威“開火”》,2024年6月14日,https://www.sohu.com/a/785794320_114984。

[13]T. Hosking, P. Blunsom, M. Bartolo, “Human Feedback Is Not Gold Standard,“ arXiv preprint arXiv:2309.16349, 2023; J. Yang, H. Jin, R. Tang et al., “Harnessing the Power of LLMs in Practice: A Survey on ChatGPT and Beyond,“ ACM Transactions on Knowledge Discovery from Data, 2024, 18(6).

[14]《一文讀懂:AI大模型訓(xùn)練中的核心版權(quán)問題》,2023年10月19日, http://news.sohu.com/a/729633870_455313;《大模型版權(quán)爭議再起 紐約時報起訴OpenAI和微軟》,2023年12月28日,https://finance.sina.com.cn/jjxw/2023-12-28/doc-imzzpyuc6959399.shtml。

[15]D. Yu, P. Kairouz, S. Oh et al., “Privacy-Preserving Instructions for Aligning Large Language Models,“ arXiv preprint arXiv:2402.13659, 2024; V. Patil, P. Hase, M. Bansal, “Can Sensitive Information Be Deleted from LLMs? Objectives for Defending Against Extraction Attacks,“ 2023, https://openreview.net/pdf?id=7erlRDoaV8.

[16]《違規(guī)使用新聞出版商數(shù)據(jù)訓(xùn)練大模型,谷歌在法被罰2.5億歐》,2024年3月26日, https://new.qq.com/rain/a/20240326A0A27N00。

[17]《習(xí)近平主持召開企業(yè)和專家座談會強調(diào):緊扣推進中國式現(xiàn)代化主題 進一步全面深化改革》,2024年5月23日,https://www.gov.cn/yaowen/liebiao/202405/content_6953237.htm?menuid=197。

責(zé) 編∕包 鈺 美 編∕梁麗琛

New Situation of and Reflection on the Development of Large Model of Artificial Intelligence

Xiao Yanghua

Abstract: With the continuous progress of related technologies, the development of large models presents new trends such as deep integration with data elements, increasingly becoming infrastructure, and shifting the focus of large model development from base models to application ecology. In response to the new situation and new trend of the development of the large model industry, we must establish a holistic and comprehensive view of the development of large models, and actively adopt new countermeasures such as accelerating the construction of artificial intelligence education system, establishing an interdisciplinary research system with intelligent science as the core, promoting the coordinated development of large models and data elements, and adhering to the diversified development path of large models. As an advanced technology, large model has two sides. While actively taking measures to promote its benign development and release the potential of its application value, we should also pay close attention to the negative issues caused by its abuse, misuse and evil use, such as the proliferation of false content, and affecting the development and cultivation of human mind and ability. We should take proactive measures to manage and control risks.

Keywords: large model, artificial intelligence, risk control, large model application

[責(zé)任編輯:包鈺]