著者:
(1)Yigit Ege Bayiz、テキサス大学オースティン校、電気・コンピュータ工学部、米国テキサス州オースティン(Eメール:[email protected])
(2)Ufuk Topcu、テキサス大学オースティン校航空宇宙工学および工学力学、米国テキサス州オースティン(メール:[email protected])。
我々は誤情報対策の方法を、検閲、デバンキング、プレバンキング、識別の4つのカテゴリーに分類しています。最初の3つのカテゴリーはすべて、誤情報の影響を軽減することを目的としています。検閲とは、ネットワーク内での情報の伝播を制御して誤情報の拡散を抑制することを目的としたあらゆる方法を指します[7]、[8]。検閲はソーシャルネットワーキングプラットフォームでは一般的ですが、言論の自由に関連する重大な問題を提起します。
デバンキングとは、誤情報が広まった後に正しい情報をユーザーに提供することで誤情報を訂正することを指します。一方、プレバンキングとは、誤情報が広まる前に正しい情報を発信することを指します。デバンキングの自動化された例としては、誤情報を含むテキストコンテンツをデバンキングすることを目的とした数多くの自動ファクトチェック方法があります [9]、[10]。現在の社会心理学の理解では、誤情報に対抗する効果の点でプレバンキングがデバンキングよりも優れていることが示されています [4]、[6]、[11]。本稿では、ソーシャルネットワーキングプラットフォームでユーザーへのプレバンキングの配信時間を自動的に最適化するアルゴリズムを開発することで、プレバンキングの自動化に貢献します。
識別とは、ソーシャルネットワーク内の誤情報コンテンツを検出することを目的としたあらゆる方法を指します。これらのモデルでは、自然言語処理モデル [12]、[13] がよく使用されます。Del Vicario ら [14] は、誤情報の伝播特性により、コンテンツ分類に依存せずに検出できることを示しました。最近では、Shaar ら [15] が、すでに事実確認された主張を識別する方法を紹介しました。この論文では、誤情報検出を直接使用していません。ただし、誤情報のコンテンツはすでにわかっていると想定しているため、正確な誤情報検出は、ここで紹介する方法の前提条件となります。
事前バンキング配信の最適な時間を決定するには、誤情報が対象のユーザーに届く時期を正確に推定する必要があります。この推定には、噂の伝播モデルが必要です。この論文では、誤情報の伝播をモデル化するために、コンパートメントモデルとしても知られるエピデミックモデル [16] に大きく依存しています。その名前が示すように、これらのモデルは疫学に基づいており、ユーザーを感受性や感染者などのさまざまなカテゴリに分割することで噂の伝播をモデル化し、これらのパーティションが時間の経過とともに相互作用するルールを定義します。誤情報のモデリングでは、さまざまなエピデミックモデルが使用されています [17]。これらの最も一般的なものは、SI [18]、SIR [19]、[20]、SIS [21]、[22] モデルです。SI (感受性-感染) モデルはモデル化が簡単で、多くの場合、任意のグラフモデルによる分析が可能な唯一のモデルです。 SIR (感受性-感染-回復) と SIS (感受性-感染-感受性) は SI モデルを改良し、シミュレーションに大幅な計算の複雑さを導入することなく、より正確なモデルにします。これらの改良にもかかわらず、SI 伝播は、その単純さと、誤情報伝播の初期段階 (誤情報に対抗するための最も重要な段階) で SIS モデルや SIR モデルに匹敵する動作を持つことから、依然として使用されています。この論文では、SI モデルを使用して誤情報の伝播を推定します。
この論文はCC 4.0ライセンスの下でarxivで公開されています。