• logo

賴祥蔚/大數據洩漏天機

圖取自Pixabay(CC0 PublicDomain)

 柯文哲以政治素人之姿在2014年當選台北市長,輿論認為頗多是靠著大數據的貢獻。一時之間從中央到地方都掀起一股熱潮,大數據儼然成為顯學。

 如今檢視政府應用大數據的情況,令人太吃驚。從政府機構怎麼使用大數據,就可以發現一個天大機密:政府不懂大數據。

 大數據範圍很廣,以輿情監測來說,主要是透過社群聆聽(social listening),可以自己開發程式,也可以委託專業機構。

 社群聆聽的專業機構發展出了方便操作的介面,可以簡易操作,跟套裝軟體差不多。

 中央部會或地方政府想要進行社群聆聽、了解輿情,應該由專責部門統一進行,花一筆費用就可以幫整個部會或地方政府進行全盤了解。可惜政府機構應用這些服務的方式卻不是這樣,除了還有政府機構是「手工」檢測網路民意,也有政府機構雖然開始使用大數據,卻是多個二、三級單位各自為政,分別委託專業機構,一來沒有統整,二來也花了更多政府預算。搜集網路意見不難,就如同做民調不難,但是粗糙的民調不能反映民意,比民調更加即時迅速的大數據與社群聆聽也是如此。

 要聆聽真正的網路輿情,程式好不好、資料庫完不完整、語意分析正不正確,三者都很重要。除此之外,要如何過濾網路上的假民意,更是現在的當紅話題。

 2017年針對假民意有許多發現:Facebook向國會提出報告說特定組織利用假帳號,長期在美國散發特定的價值觀,而這些組織背後都有俄國的支持;英國卡地夫大學發現,有俄羅斯支持的社交媒體假帳號在散播分化社會的輿論;BBC也在2017年報導指出,先前巴西大選受了假帳號的影響。

 先前有些受雇網軍一個人負責20個以上的假帳號,人工作業就已影響民意與大選,如果AI人工智慧發威,影響更驚人。

 研究大數據多年的意藍科技董事總經理楊立偉指出,對於假帳號、假輿情的偵測,台灣才剛開始,主要是透過帳號狀態與發文行為是否出現先後不一致來過濾,可以揪出6、7成的假帳號。

 透過社群聆聽,可以隨時掌握最新民意,政府與企業都不可不學。不過從當前的實際情況來看,政府連在大數據的應用上都還有所不足,更遑論進一步投入研究發展。

 新一波的選舉又將來到,想要快速掌握民意趨勢,除了敏銳的政治判斷與民調,還要有堅強的大數據科學當後盾。政府首長們如果到現在都仍是大數據的門外漢,只怕很快就會在時代的浪潮中慘遭淘汰。

<<本文經作者同意刊載>>

●作者:賴祥蔚/台灣藝術大學廣播電視學系教授、中華傳播管理學會理事長,臉書:https://www.facebook.com/lai606

●本文為作者評論意見,不代表《istudy文教新聞資訊網》立場

●原文登載於《中時電子報》