當前位置:首頁 >  科技 >  IT業(yè)界 >  正文

GAITC專題論壇丨金兼斌:虛假科學信息治理依靠社會民智,AI是整合關鍵

 2020-07-29 12:06  來源: 互聯(lián)網(wǎng)   我來投稿 撤稿糾錯

  域名預訂/競價,好“米”不錯過

7月26日,由中國人工智能學會主辦、新浪新聞聯(lián)合浙江大學承辦的2020全球人工智能技術大會(2020GAITC)“AI時代下的新媒體與社交娛樂”專題論壇拉開帷幕,新浪集團首席信息官、新浪AI媒體研究院院長王巍,浙江大學特聘教授、悉尼科技大學教授、百度研究院訪問教授楊易共同擔任論壇主席。

清華大學大學新聞與傳播學院學術委員會主任、教授金兼斌在本次專題論壇上,與來自業(yè)界、學術界的嘉賓們分享了《人工智能助力虛假科學信息的監(jiān)測》。

圖注:清華大學大學新聞與傳播學院學術委員會主任、教授金兼斌作主題演講。

金兼斌認為,社會化媒體時代,虛假科學信息的治理,必須充分依靠對分散在社會各個平臺上的民智的整合,而人工智能則是實現(xiàn)這種有效整合的關鍵。

關于應對虛假科學信息,利用人工智能技術進行更好的監(jiān)測,他提到,基于虛假科學信息的語言特征、內(nèi)容特征和對象特征,“表示學習”、“知識圖譜”、“信息挖掘”是三種有針對性的解決思路。

以下為金兼斌演講實錄,內(nèi)容經(jīng)編輯略有刪減:

各位嘉賓好,首先非常榮幸受新浪新聞和浙江大學的邀請來參加這一論壇。剛才聽前面幾位專家分享的時候,頗感心有戚戚。諸多內(nèi)容和觀點,嘉賓之間并未事先溝通過,但卻遙相呼應。

今天我將主要談談虛假科學信息的監(jiān)測問題。借用剛才Amy Bruckman女士的話,知識本質(zhì)上是一種共識的社會建構。尼采有類似的表述,即世界上沒有所謂的事實,只有解讀。

在日常的內(nèi)容消費中,很多時候我們面臨這樣的場景:有一定共同認可的事實基礎的現(xiàn)象或事件,不同人對事件的性質(zhì)以及可能的社會后果,可以有截然不同的解讀和判斷。諸多人與人之間、群體與群體之間、國家與國家之間的矛盾、爭執(zhí)乃至交惡、撕裂,由此而生。

7月24號,也就是兩天前,《科學》雜志上發(fā)表了一篇中科院武漢病毒研究所研究員石正麗回答《科學》的18問專訪的文章,文章題目以“特朗普欠我們一個道歉”這一來自石正麗的引語開始。提問者對所提18個問題做了精心的準備,涉及到武漢病毒所和此次新冠疫情之間有無關聯(lián)的大量專業(yè)問答,雖然字里行間不乏春秋筆法,但總體上問答雙方都十分克制,只講事實,沒有任何情緒化的表達。這是很難得的。因為在人們?nèi)粘K姷拇罅可婕翱茖W事實的各種網(wǎng)上內(nèi)容表述中,“后真相”時代觀點先行、事實成為“任人打扮的小姑娘”,已經(jīng)是見怪不怪的現(xiàn)象。這正是我今天給大家分享的這個主題的時代和信息傳播環(huán)境之大背景。

今天,科學已經(jīng)成為我們當代社會文明中的亮麗底色。另一方面,科學不光是科學,它還關乎政治,國際上圍繞疫情起源的爭議和污名化就是明證。而對普通民眾而言,科學關乎日常生活質(zhì)量和對現(xiàn)代文明帶來的福祉的享用。如何確保確保民眾日常生活接觸到的科學性信息的質(zhì)量,可謂茲事體大。

我將要介紹的內(nèi)容,是由我們團隊的博士后陳慧敏和碩士生朱澤宇與我一起準備完成的。

今天的主題是AI時代下的新媒體與社交娛樂。剛才王巍總講到內(nèi)容生產(chǎn)從PGC到UGC再到現(xiàn)在TGC的多元化趨勢。我們身處信息生產(chǎn)的社會化、大眾化乃至萬物生生不息的時代。另一方面,人作為信息消費者,又有其永遠無法逾越的一些邊界條件,比如一天只有24小時,信息消費的時間和其他活動包括睡眠所占的時間,是一種此消彼長的零和游戲。今天,社會的發(fā)展已經(jīng)從規(guī)模發(fā)展轉(zhuǎn)變到高質(zhì)量發(fā)展階段,其實信息的生產(chǎn)和消費,也必然面臨這樣的轉(zhuǎn)變。我們不缺內(nèi)容,缺的是高質(zhì)量的內(nèi)容,特別是缺由消費者特定場景所定義的高質(zhì)量內(nèi)容,包括事關國計民生的優(yōu)質(zhì)科學性內(nèi)容。

剛才Bruckman教授講到,知識本質(zhì)上是一種社會建構。其實各種各樣的虛假科學信息背后,常常也涉及到了很多不同的價值觀和社會力量之間的話語權角逐和爭斗。諸如病毒起源、戴口罩的必要性等問題,不僅是科學性問題,當中所涉及的話語權和定義權,還關乎大國博弈、防疫政策和責任歸因的選擇和感知。因為我們對世界的認知,歸根到底是受各種所消費內(nèi)容的涵化和型塑的。

也正如此,提升民眾的科學素養(yǎng),讓民眾對事關其生活質(zhì)量的各種科學性信息具有基本的鑒別能力或解惑途徑,在大力推進科技創(chuàng)新的同時,同步推進科學普及,是一體兩面的重要舉措。面對海量的信息的觸手可及,真正有用的高質(zhì)量信息如何為民所用,需要有可落地的方案。而有效監(jiān)測民眾每日接觸到的內(nèi)容中的虛假科學信息并及時加以提醒、清除、糾錯糾偏,是社會良治中信息治理的題中之義。

無論是科學信息的生產(chǎn)還是虛假科學信息的監(jiān)測,社會化協(xié)同都是核心機制。就科學信息的生產(chǎn)而言,不同機構、領域的專家或科技工作者通過專業(yè)發(fā)表和圈層日常交流,把科學信息源源不斷輸出到整個社會的信息傳播系統(tǒng)中。另一方面,科學信息在通過媒體特別是社會化媒體的多層、多級傳播過程中,大量民眾既作為內(nèi)容的消費者又作為內(nèi)容的傳播者參與生產(chǎn),這一過程降低了科學信息的生產(chǎn)和傳播的門檻。這是我們進行虛假科學信息監(jiān)測所面對的信息生態(tài)環(huán)境。

下面我們首先把虛假科學信息的信息特征做一個簡單的梳理。我們從三個方面進行總結,包括語言特征、內(nèi)容特征和對象特征。

首先是語言特征。虛假科學信息常常有一些明顯的語言表達方式上的特征,比如“長期服用降壓藥會致死”這類說法,其陳述中通常特別強調(diào)致死、致癌、致殘這一類嚴重后果。從傳播學的角度來看,這樣的傳播策略叫訴諸恐懼。這類信息在涉及有關可能風險時,常??浯笃湓~,或者斷章取義,典型如離開劑量談毒性。事實上,鑒別社會化媒體上司空見慣的各種食藥品風險內(nèi)容,一定要和具體人群和應用場景結合起來,才有意義。

還有一種常見的表述,是對某類疾病或危害的簡單歸因,即科學方法論上所說的還原論謬誤。這種表述常常有意無意混淆可能性和必然性之間的差異,把多種原因?qū)е碌默F(xiàn)象,簡單歸咎于某一特定因素。比如“常吃米飯會誘發(fā)糖尿病”這類聳人聽聞的說法,背后就是一種還原論邏輯。

第二是內(nèi)容特征。虛假科學信息的內(nèi)容,不同于一般的虛假信息之處在于,其所關涉的事實是否準確,涉及到科學性和專業(yè)性知識或邏輯判斷問題,而在這方面,虛假科學信息可以巧妙地布下很多認知陷阱,在似是而非間,混淆是非,誤導人們的認知和行為。如“食鹽含亞鐵*,不可食用”的說法,首先是有意引導民眾把亞鐵*和*進行聯(lián)想置換,產(chǎn)生恐懼。亞鐵*跟*是不一樣。其次,食鹽中只含有的極為微量的亞鐵*,一般人每天食用的食鹽量里面包含的亞鐵*,完全不會對人體構成健康危險。但這些相對專業(yè)的知識和邏輯,可能并不為普通民眾所熟悉和了解。

第三是對象特征。很多虛假科學信息或者科學謠言的描述對象,常常是一些新興事物,如“量子波動速讀”“5G基站可致癌”“雙黃連可防新冠病毒”等流言或謠言,其中涉及的事物都比較新,超出大部分民眾的知識儲備。媒體或民眾對其真?zhèn)谓柚延兄R難以辨識,于是就會有寧可信其有不可信其無的心理,導致以訛傳訛。

如何進行虛假信息的鑒別或監(jiān)測?基本上有兩種思路,即人工鑒別和機器鑒別。當然在辟謠實踐中,常常是兩種方法結合起來的,即機器快速從海量、動態(tài)的信息中定位到一些可疑內(nèi)容,然后通過一系列知識體系、專家系統(tǒng)和人工方法,來判定有關信息的真?zhèn)?。值得指出的是,兩種方式各有優(yōu)劣。機器識別效率高,但難以精準識別專業(yè)性較高的前沿科技內(nèi)容,所以有時仍需要依賴人工;人工識別包括專家解讀的優(yōu)勢在于,可以判別一些現(xiàn)有文獻和知識庫中尚未有明確論述的一些新興科學性內(nèi)容表述的真?zhèn)?,如新冠病毒爆發(fā)以來,伴隨病毒傳播的還有諸多虛假科學信息。由于人們對新冠病毒的性質(zhì)的認知也有一個過程,因此,當有關新冠病毒特性的一些科學流言和謠言出現(xiàn)時,依賴已有的知識體系來進行機器識別,注定是不可靠的,而是需要仰仗一線醫(yī)務工作者和科學家的最新研究發(fā)現(xiàn)和臨床經(jīng)驗才能判斷真?zhèn)?。當然人工鑒別的缺點是效率低。因此,兩者需要有機結合。

下面是我針對我們前面對虛假科學信息三個方面特征的總結梳理,談談人工智能助力虛假科學信息監(jiān)測的解決思路。

基于虛假科學信息的語言特征,我們可以采用表示學習技術,來對海量動態(tài)的內(nèi)容中的虛假科學信息進行快速的初步定位和識別。通過表示學習,把待判別文本轉(zhuǎn)化為低維度向量,隨后利用深度神經(jīng)網(wǎng)絡,學習這些向量表示中的信息,達到快速進行語義分析的目的?;谡Z言特征進行的語義分析技術,目前相對來說已經(jīng)比較成熟。這是進一步對有關內(nèi)容科學性進行判別的前提,即我們首先需要讓機器知道有關內(nèi)容的主題和觀點具體是什么。

基于內(nèi)容特征,我們可以借助知識圖譜作為破解虛假科學信息的途徑。知識圖譜是人類已有知識的精華,是人類構建的知識網(wǎng)絡,網(wǎng)絡里的每個節(jié)點就代表了某一個概念,而節(jié)點之間的連邊,就代表了這些概念之間的關聯(lián)。我們可以將知識圖譜和神經(jīng)網(wǎng)絡結合,識別虛假科學信息,即從待判別文本中,抽取出重要的概念以及概念之間的關聯(lián),并與知識圖譜中這兩個概念對應的實體節(jié)點之間的關聯(lián)路徑進行對比,看看待判別文本中概念之間的關聯(lián)性(如“轉(zhuǎn)基因食品”引發(fā)“癌癥”這一表述)的真?zhèn)位虼嬖诘目赡苄?。在科學謠言的判別中,大部分謠言內(nèi)容的破解,利用知識圖譜能夠高效地進行。

基于虛假科學信息的對象特征,即有關話題對象或主題通常較新,科學性和專業(yè)性較強,我們提出多層次信息挖掘這樣一個思路和對策。

所謂多層次,根據(jù)廣義上的“知識圖譜”之“知識”的成熟度,我們區(qū)分了正式出版的文獻、預印本平臺內(nèi)容、以及各種知識問答類眾包平臺。典型的出版文獻通常是經(jīng)過同行評審的,其包含的概念和知識體系相對比較成熟、自洽,大致和上述通常意義上的“知識圖譜”中的來源知識對應;鑒于正式出版的審稿、修改周期通常比較長,而諸如新冠疫情這樣的公共衛(wèi)生問題又人命關天十分緊急,因此,近年來興起一種預印本發(fā)布制度,讓很多前沿研究成果可以第一時間可以為同行甚至媒體知曉和參考,雖然其中的內(nèi)容和結論可能存在出錯風險,但在對有關新問題、新挑戰(zhàn)缺乏更好認知和對策的情況下,聊勝于無,預印本平臺上看似不一定“成熟”的內(nèi)容,對于有關新興科學主題的信息真?zhèn)蔚恼鐒e,仍可能起到極有價值的參考作用。最后就是知識問答類眾包平臺,以及廣義上存在于各種論壇、圈層上針對有關新興、前沿問題的專業(yè)內(nèi)容探討和分享,理論上,這部分內(nèi)容也應該作為一個社會知識生產(chǎn)的一種機制,納入到虛假科學信息鑒別可資參考和依賴的來源中。我們可以想象,在未來的某一天,我們的人工智能發(fā)展到這樣一種理想的水平,即每一個用戶在其生活場景中遇到的每一個不知真?zhèn)蔚目茖W問題,都可以第一時間通過諸如語音搜索引擎這種方式,向全網(wǎng)或全社會詢問或求助;而全網(wǎng)或全社會也能在第一時間,把對這個問題的最新、最優(yōu)、最權威認知,以提問者所能理解的方式回應給他,實現(xiàn)無縫交互。借助于無所不在的像神經(jīng)網(wǎng)絡一樣的社會信息傳播系統(tǒng),一個社會通過人工智能,最終得以把整個社會的民智進行有效的萃取整合。由此,整個社會的知識和智慧,真正成為每一個個體予求予取的外腦般的不竭源泉。到那個時候,無論虛假信息如何千變?nèi)f化深藏不露,都將被人們輕易鑒別。

顯然,我們離這一天還比較遙遠。要實現(xiàn)這樣的一幅理想圖景,我們不僅需要整合知識,還需要協(xié)調(diào)社會不同民眾的價值觀,即對事實的解讀。不僅涉及到對知識的整合,還涉及到對一個社會倫理價值道德觀念的整合,體現(xiàn)一個社會的集體理性和智慧。因此,從根本意義上言,這種多層次信息挖掘和綜合研判,是對全社會智慧的有效整合。

總結而言,我們提出了這樣一套基于人工智能進行虛假科學信息監(jiān)測的框架和思路?;谡Z言特征,機器學習和語義分析可以幫助我們識別海量內(nèi)容中科學性方面可疑的信息,這方面的人工智能技術現(xiàn)在已經(jīng)比較成熟?;趦?nèi)容特征的檢測,利用已有的知識圖譜,可以比較高效的解決大量的虛假科學信息的識別問題,但是它可能不能解決層出不窮的新興話題的真?zhèn)闻袛鄦栴}?;趯ο筇卣鞯亩鄬哟涡畔⑼诰?,通過對分散在社會不同系統(tǒng)和平臺上的知識體系和認知主體的智慧集成,理論上,我們可以對各種各樣的虛假科學信息的鑒別需求作出快速回應。

值得強調(diào)的是,這個過程不僅涉及知識鑒別,還涉及到社會層面的組織和協(xié)同。事實上,大數(shù)據(jù)和社會化媒體的發(fā)展,一方面具有對普通民眾和整個社會進行賦能的潛力;另一方面,大量虛假、不實信息充斥其中,也使得有效信息的甄別和利用成為新的挑戰(zhàn),賦能不當,可能徒耗民眾的精力、時間和資源,變成耗能。這不是一個小問題。如我一開始所言,科學信息不光是科學,它還可能關涉到政治和經(jīng)濟,關乎大國之間的博弈和競爭,涉及到普通人的日常生活,因此,如何進行一個社會的信息良治,值得我們投入更多的關注。

申請創(chuàng)業(yè)報道,分享創(chuàng)業(yè)好點子。點擊此處,共同探討創(chuàng)業(yè)新機遇!

相關文章

  • 盤古大模型,不一樣的「煙火氣」

    文/八真出品/節(jié)點商業(yè)組2023年已過半,但AI大模型依舊熱的發(fā)燙。科技部新一代人工智能發(fā)展研究中心的《中國人工智能大模型地圖研究報告》顯示,迄今為止,中國已發(fā)布79個10億參數(shù)規(guī)模以上的大模型。與此同時,伴隨著越來越多的選手謀局落子和下場奪舍,把這場摧枯拉朽的科技盛典推向高潮,更多人開始思考,AI

    標簽:
    ai技術
  • PRINS.AI榮獲2023SAIL之星

    PRINS平臺被世界人工智能大會授予2023年人工智能行業(yè)著名的SAIL之星。這證明了公司在AI人工智能方面所做的努力。PRINS(PRINSAITechnologyLtd)是一家專注于虛擬體驗技術解決方案的技術公司,由人工智能研究人員和技術專家組成的核心團隊創(chuàng)立。目前已獲得多家知名投資機構的投資,

    標簽:
    ai技術
  • AI+軟件,為什么可以看多用友?

    文/七公出品/節(jié)點商業(yè)組2023年,“ChatGPT”的問世讓人工智能(AI)空前興奮和繁盛。有人高呼這是“iPhone時刻”,有人振臂這是第四次工業(yè)革命,也有人驚嘆這是新一代的“火”和“電”。總而言之,這場史無前例的大變革,正在復刻2015年前后的“互聯(lián)網(wǎng)+”行情,推動“AI+”成為未來十幾年的發(fā)

    標簽:
    ai技術
  • 匯聚中國AI頂尖力量 云天勵飛參與華為AI大模型聯(lián)合創(chuàng)新

    2023年7月6日,第六屆世界人工智能大會(WAIC2023)在上海開幕,“人工智能大模型”是本屆大會的備受矚目的話題,據(jù)悉,在昇騰AI大模型的創(chuàng)新研發(fā)中,華為聯(lián)手26家行業(yè)領軍企業(yè),組建了一支協(xié)同創(chuàng)新的“AI明星隊”,云天勵飛作為中國人工智能企業(yè)的杰出代表,和互聯(lián)網(wǎng)大廠、運營商、科研院所等優(yōu)秀團隊

    標簽:
    ai技術
  • 用友大易:邁入AI招聘2.0時代,讓人力資源回歸本質(zhì)

    這幾個月來,以ChatGPT為代表的生成式AI展現(xiàn)出的能力令世界驚嘆。自從2016年AlphaGo戰(zhàn)勝李世石掀起了一波AI浪潮后,AI仿佛已經(jīng)沉寂了很久,ChatGPT的橫空出世就如同一束耀眼的光芒,讓AI這個名詞重回C位。過去在AI1.0時代,主要通過訓練模型來實現(xiàn)圖像識別、聲音識別、語言處理等特

    標簽:
    ai技術

熱門排行

信息推薦