作者:
(1)Yigit Ege Bayiz,德克萨斯大学奥斯汀分校电气与计算机工程系,美国德克萨斯州奥斯汀(电子邮箱:[email protected]);
(2)Ufuk Topcu,德克萨斯大学奥斯汀分校航空航天工程和工程力学,美国德克萨斯州奥斯汀(电子邮箱:[email protected])。
我们将反击虚假信息的方法分为四类:审查、揭穿、预先揭穿和识别。前三类都试图减少虚假信息的影响。审查是指任何旨在通过控制网络中信息传播来遏制虚假信息传播的方法 [7],[8]。审查在社交网络平台上很常见,但它引发了与言论自由有关的重大问题。
揭穿是指在错误信息传播后向用户提供正确信息来纠正错误信息,而预先揭穿是指在错误信息传播之前发布正确信息。揭穿的一个自动化例子是众多自动化事实核查方法,它们都旨在揭穿虚假的文本内容 [9],[10]。目前对社会心理学的理解表明,在反击错误信息的有效性方面,预先揭穿优于揭穿 [4],[6],[11]。在本文中,我们通过开发算法来自动优化社交网络平台上预先揭穿向用户的传递时间,为预先揭穿的自动化做出了贡献。
识别是指旨在检测社交网络中错误信息内容的任何方法。这些模型通常利用自然语言处理模型 [12]、[13]。Del Vicario 等人 [14] 表明,错误信息的传播特性允许检测而不依赖于内容分类。最近,Shaar 等人 [15] 介绍了一种识别已经过事实核查的声明的方法。在本文中,我们不直接使用错误信息检测。但是,我们假设我们已经知道错误信息的内容,因此准确的错误信息检测仍然是我们提出的方法的先决条件。
确定最佳的预发布时间需要准确估计错误信息何时会到达目标用户手中。这种估计需要一个谣言传播模型。在本文中,我们主要依赖流行病模型 [16](也称为房室模型)来模拟错误信息传播。顾名思义,这些模型基于流行病学,通过将用户划分为不同类别(例如易感者或感染者)来模拟谣言传播,然后定义这些分区随时间相互作用的规则。在错误信息建模中使用了多种流行病模型 [17]。其中最常见的是 SI [18]、SIR [19]、[20]、SIS [21]、[22] 模型。SI(易感-感染)模型易于建模,并且通常是唯一允许使用任意图模型进行分析的模型。 SIR(易感-感染-恢复)和 SIS(易感-感染-易感)改进了 SI 模型,使其更加准确,而不会给模拟带来显著的计算复杂性。尽管进行了这些改进,SI 传播仍然有用,因为它很简单,而且在错误信息传播的初始阶段(这是打击错误信息的最关键阶段)具有与 SIS 和 SIR 模型相当的行为。在本文中,我们使用 SI 模型来估计错误信息传播。