科學家大戰“殭屍”:社交網絡機器人或妨礙研究調查
2020年03月07日10:49

  文章來源:Nature自然科研

  原文作者:Heidi Ledford

  自動生成的社交媒體內容可能會妨礙研究調查。

  社交媒體機器人批量吐出計算機生成的內容,被指通過散佈錯誤信息,影響選舉,損害公共健康。現在,一些社會科學家提出了一項新的指控:對於一些通過挖掘Twitter、Reddit和Instagram等熱門網站,以獲取有關人類健康和行為信息的研究,社交媒體機器人會混淆視聽。

  這類網站的數據可以幫助科學家瞭解:自然災害如何影響心理健康;為什麼美國的年輕人對電子煙趨之若鶩;人們如何通過複雜的社交網絡聚集起來。要開展這些研究,就要將真實的聲音與網絡機器人的“聲音”區別開來。

  “網絡機器人被設計成像真人一樣上網,”洛杉磯南加州大學的社會科學家Jon-Patrick Allem說,“如果研究人員想要描述公眾的態度,就必須確保他們在社交媒體上收集的數據確實來自真人。”

  2013年,丹麥技術大學的計算機科學家Sune Lehmann為了課堂上的一個社交網絡實驗,設計了他的第一批網絡機器人。他說,當時Twitter上的機器人非常簡單模糊,它們的存在主要是為了增加一些Twitter賬號的粉絲數量。Lehmann希望讓學生知道,這類機器人會如何操縱社交系統。為此,他們共同設計了歌手Justin·比伯(Justin Bieber)的虛擬粉絲機器人。

  “比伯機器人”(Bieber Bots)的設計很簡單,並且迅速吸引了成千上萬的關注者。但是,社交媒體機器人在不斷演變,越來越複雜,難以被發現。2016年美國總統大選之後,這些機器人迅速成為公眾關注的焦點;有人指控稱,大量網絡機器人被部署在社交媒體上,為特朗普在選舉中造勢。“突然之間,它變成了大家都感興趣的東西。”Allem說。

  之後,Allem用證據表明,網絡機器人更容易生成電子煙有助於戒菸1的推文,其概率是真人推文的兩倍——而事實是,這種論斷仍有很大的爭議。還有研究發現,機器人更容易宣揚大麻未經證實的健康益處2。這些研究都是依靠算法來估計某個Twitter賬號為自動運行賬號的可能性。但是Allem表示,儘管有Botometer和BotSlayer之類的機器人檢測工具,許多社會科學和公共衛生研究人員仍然未能採取必要步驟,把可能為自動生成的內容從其數據中過濾掉。這裏的部分原因在於,有些研究人員認為自己不具備這麼做的專業知識。

  Amelia Jamison警告說,這種疏忽會汙染整個數據集。Amelia Jamison在馬里蘭大學研究健康差異,她在社交媒體上挖過反對疫苗接種的帖子。她說:“你可能會把它們視作真實討論的一份子,聽取這些聲音,但其實它們誇大了一些社群本身沒有表達的意見。”她指出,以她的研究課題為例,如果不剔除網絡機器人的影響,她可能會認為反對疫苗的聲音越來越多或是以變相的方式又出現了,而實際情況並非如此。

  德國萊布尼茨社會科學研究所的信息科學家Katrin Weller認為,該領域必須解決的一個問題是如何定義網絡機器人。並非所有的網絡機器人都在惡意散佈錯誤信息:某些機器人會提供氣象站的最新天氣情況、浮標採集的海平面變化數據,或是一般新聞報導。Weller指出,一些研究人員對Twitter機器人的定義是,每天發送消息超過一定數量的賬號——這個定義較為寬鬆,會把一些愛刷屏的真人推特賬號誤算在內。

  其他定義更為複雜一些。機器人檢測器與機器人開發者始終處於一種“你追我趕”的競賽中。第一代社交媒體機器人還是相對簡單的程式,只會固定地轉發他人的帖子。但是時至今日,隨著機器學習的不斷髮展,能夠發佈原創內容的複雜機器人已經問世了。有些機器人會不定時地發佈一些內容,還會模仿人類的習慣,例如在大家可能睡著的時候不發任何東西。一些機器人開發者會將真人生成的內容與自動生成的內容混在一起,增強機器人的偽裝能力。

  “一旦你對網絡機器人以及檢測它們的方式有了更多的瞭解,它們的創建者也掌握了同樣的信息。”瑞士蘇黎世大學的定量健康地理學研究人員Oliver Grübner說,“這是一個非常棘手的問題。”

  像Lehmann一樣,一些社會科學家正在自己設計機器人,來開展社會實驗。賓夕法尼亞州立大學的政治學家Kevin Munger和他的同事製造了一些特別的機器人,這些機器人能識別使用種族主義語言的Twitter用戶,並對其進行指責。研究人員讓一組機器人使用白人男性作為頭像,另一組使用黑人男性作為頭像。Munger發現,Twitter用戶在被前一組機器人指責後,更有可能淡化種族主義言論3。

  在比伯機器人大獲成功之後,Lehmann又設計出了更先進的機器人,以研究行為如何從一個群體傳播到另一個群體。但是,由於網絡機器人已經聲名狼藉,可能出現的公眾抗議讓他考慮放棄該方法。“圍繞網絡機器人的一切都糊了。” 他說,“我有時候會想:‘我要再找一個安靜的角落,在不會招致爭議的情況下安心做研究。’ ”

關注我們Facebook專頁