2019事實查核工作坊/台中場報導六:自動化事實查核 台灣的現實與理想

自動化事實查核 台灣的現實與理想

特約記者/邱珮文

優質新聞發展協會與台灣事實查核中心5月26日在台中舉辦「2019假新聞與事實查核工作坊」,邀請開放知識基金會台灣代表徐子涵分享自動化事實查核技術。徐子涵認為,台灣應該建立一套像是防疫機制的自動化查核分級系統,隨時掌握疫情範圍與受災對象,並根據假訊息傷害程度做出即時反應。不過,他也指出,目前對於台灣一般民眾而言,事實查核的用途並不明顯;國內也缺乏對自動化查核機制的研究和團隊,進而限制相關技術的運用。

比起資訊戰 台灣更像網路械鬥

開放知識基金會(Open Knowledge Foundation)是2004年於英國劍橋成立的全球性非營利性網絡,台灣代表徐子涵長期致力於開放資料以及開放政府的資通訊政策研究,也曾受邀擔任聯合國地理空間資訊委會(GGIM)願景小組之徵詢顧問。針對假消息議題,徐子涵試圖從技術的使用與限制等不同角度看待問題。

面對總統大選前境外勢力可能引發的資訊戰疑慮,徐子涵表示,根據他過去在國外服務的經驗,見證過真正的資訊戰規模,他認為,大家如今所見的網路現狀用「網路械鬥」來形容更為貼切。而儘管台灣目前事實查核的用途有限,但是,在提供正確訊息、數位民主防衛、培養數位素等方面,事實查核還是核心的一環。換句話說,事實查核本身可能無法發揮太大作用,但是缺少這一環,台灣將面臨的會是一場網路混戰。

徐子涵認為,基於行動裝置的介面簡單與網路吃到飽的便利性等特性,假訊息真正影響到的對象是手機用戶,而非鍵盤使用者。他以緬甸為例,指出該國2012年軍政府當政時期,之所以假消息災情慘重,就是因為軍政府掌握著手機用戶的上網途徑;當時,一張sim卡要價台幣40萬,人民上網的唯一窗口就是透過手機上流量免費的Facebook(Free Basics版本)程式,因此,所有的資訊都在臉書聚集,緬甸軍政府也藉此製造輿論以攻擊羅興亞人。

至於台灣,徐子涵提出三個假訊息氾濫的原因。首先,新聞自由度高,位居東亞第二;其次,手機普及率高,根據統計,台灣100人有120張sim卡,遠比西歐、美國高;第三,台灣人口密度高,人際網絡關係緊密,各個議題難以分群,訊息一旦傳播,不需花費多少時間就擴散放大。

從防疫觀點做自動化查核

徐子涵指出,釐清用詞定義很重要,當講到「假新聞」、「網軍」這些用詞時,很多事情就看不清楚,因為每個事件的威脅層次、對價關係都不同,例如台灣因為高密度等特性,情報單位所要求的反應速度也相對來得高,別國的空戰策略套在台灣脈絡上就顯得不太合適。

因此,徐子涵認為,用「軍事行動」去看台灣假消息現況是有些危險的,儘管這個說法可以激起大家的危機感,但是戰況不一定這麼的敵我分明。他建議用「防疫」來形容比較洽當,也就是說,什麼樣的事件要啟動自動化查核機制,應該要設置相應的規模標準,當某些情況具高度嚴重性、會危害安全,就要優先啟動自動化機制處理。

徐子涵表示,自動化機制無法處理「事實」這部分,但是可以處理事實的「傳播」;因此,我們要先認識到「受害者的面貌」,譬如哪些族群喜歡哪種訊息的型態,對其防治方法才會越來越清楚。

他引用2018年twnic發表的網路調查結果,指出除了普遍知道傳播假消息的三個管道:Line、PTT、Facebook外,較少提到的臉書messenger雖然各年齡層平均使用率僅26.8%,唯獨在12-14歲區間中卻高達64%。徐子涵指出,這代表這群未來幾年後將取得投票權的中學生,他們目前高度依賴的通訊管道現在並未獲得任何討論關注。「由此可知,我們對整個戰場、疫情的狀況還沒看清楚。」

另外,徐子涵也提到,大家不常討論的wechat才是假訊息的「大賊窟」,使用率最高的年齡層為40-49歲區間,約26%,主要族群包括台商;還有就是假帳號氾濫的問題,像是Line、Facebook、Youtube上都很嚴重。

進一步分析不同傳播管道的時徑與影響人數,徐子涵推估,Line帳號1條訊息出去最多可以影響10萬人;What’s app一次約500人;電視新聞媒體至多1分鐘可以影響1百萬人,消息的擴散則可以多達3天至1週。他認為,藉由這些數據,可以掌握消息攻擊的速度與人數,進一步反推自動化查核機制要消化、中和這些消息所需要的最短反應時間。

在不實資訊的攻防中,徐子涵指出,攻擊者最重要的是鎖定操作的目標,再進一步捏造訊息;防禦者卻是相反方向,必須從事實出發,一步步找出捏造的訊息、操作的事件以及背後目標,每一個階段都勞心勞力;自動化機制要思考的就是如何加速這個過程。

有錢也買不到的假資訊追蹤系統

對於目前處理假資訊的技術發展,徐子涵試著播放美國影集《反恐危機》(Homeland)的片段來填補大家的想像。劇中由於一則造假影片在全美社交網路散播速度異常,而被中情局鎖定;情報人員利用一套分析系統追蹤影片散播路徑,發現訊息傳播是以幾個超大節點(node)為主,與其他小帳號互動,進一步追蹤IP發現,這些大帳號的地理位置散布在全美各地。情報人員比對分析過去兩次類似事件的追蹤紀錄,發覺都是同樣的巨大節點在操控,但是其擴散的效益、幅度和人數卻以倍數在提升。

徐子涵認為,透過從劇情中這套自動偵測威脅系統,國家情報單位藉以判斷事件危急程度與處理方針。不過,他也強調這只是影集,很多環節礙於資源、團隊、數據、法規等限制,並不能搬到現實上運用。

徐子涵還介紹了一款真實的雷達系統,可以先由系統判斷哪些訊息要做事實查核,再把訊息抓回來交給真人查證,最後公開標示這條訊息是真的或假的;甚至,這套系統能夠在24小時之內,針對一個議題所撈出來的資料,做議題分群、互動視覺化,並偵測遠方指揮官,看出是誰在帶風向、影響力大小等等。

徐子涵指出,當我們的敵人擁有類似的系統,可以精準對我方議題攻擊操作、事後不理、掌握訊息影響範圍等;一套系統背後還要考慮相應的知識、技術團隊,台灣在這方面並沒有投注足夠的研究,有錢也買不到。

集中群眾外包力量 處理高威脅

徐子涵表示,台灣目前貼近自動化查核機制的系統,是透過群眾外包進行事實查核的cofacts 訊息資料庫。不過,他坦言,這套系統的用途對於一般使用者而言效度接近於零,僅對於新聞工作者而言,會是個有趣且相對成本低廉的機制。他建議,要進一步發揮這個機制的用途,要想辦法集中議題,預先想好威脅高低的次序,將人力集中處理少數高度威脅的議題,特別是當大選前台灣網路遭到攻擊時,這套機制再連接至一般Line使用者用戶去做防疫的工作。

談到Facebook在自動判斷假帳號機制上的侷限,徐子涵認為與臉書的全球分工有關。他解釋,首先,要以自動化分析網路行為來判斷「真人」身份,在操作上是有困難的;其次,若是交由真人處理,臉書判讀繁體中文語意的編制雖然有三萬人,然而台灣並不被臉書視為優先市場(priority market),「講白了,不是做不到,而是不把台灣當一回事」。

關於事實查核的效力,徐子涵坦言,有研究整理數十篇各國文獻發現,對於「更正有用嗎?」這個問題,整體而言並不太樂觀,僅能說勉強有用。有研究就指出,相對而言,「反駁」比「警告有害」有用,批評「內容一致性」比事實查核或攻擊「來源可靠性」有用。