作者:
(1) Anees Baqir,意大利威尼斯卡弗斯卡里大学;
(2) Alessandro Galeazzi,意大利威尼斯卡福斯卡里大学;
(3) 法比亚娜·佐洛(Fabiana Zollo),意大利威尼斯卡福斯卡里大学及意大利新环境人文研究所中心。
在本节中,我们将展示分析结果,其组织方式如下。首先,我们概述了三年来选定的欧洲国家的信息格局。这一步对于确定各国广泛关注的关键主题以及区分可疑和可靠来源至关重要,从而实现连贯的比较。接下来,我们将研究各国在线讨论这些主题的共同点和差异,重点关注用户参与度和消费模式。
为了比较所选国家/地区的公共话语格局,我们的第一步是确定这四个国家/地区以及可疑和可靠来源广泛讨论的共同主题。为此,我们使用 BERTopic(Grootendorst,2022)对新闻媒体账户在三年内制作的内容进行主题建模(有关详细信息,请参阅第 2 节)。为了确定适合分析的主题,我们按年份和国家/地区划分数据集,并对每个子集运行 BERTopic 算法。图 1 中报告的结果显示了按国家/地区和来源类别划分的每年争论最多的主题。每个主题的大小代表为其做出贡献的新闻来源数量,而其位置反映了其与总体主题的相关性。流程图显示了该主题在新闻媒体中随时间推移的流行程度。
图 1 突出显示了不同国家和不同类型的新闻来源对不同主题的关注程度。值得注意的是,除了某些共同感兴趣的话题外,新闻机构还倾向于优先考虑与国家相关的主题,例如抗议、外国的影响、宗教、电动汽车和毒品合法化。我们还观察到同一国家内可疑和可靠来源所涵盖的主题存在差异。例如,可靠来源报道意大利冠状病毒疫苗的新闻机构比例高于可疑来源。此外,某些主题仅限于一种类型的来源,例如“航班”(意大利,可靠)、“水资源管理”(法国,可靠)或“巴勒斯坦斗争”(英国,可疑)。这些发现表明,兴趣水平受到国家和所考虑来源类型的影响,可疑来源表现出更广泛的兴趣,而可靠来源则更关注所有国家共同的主题。
至关重要的是,我们的分析凸显了所有国家可疑和可靠辩论之间存在共同话题。具体来说,三个话题在所有国家的辩论中都一致出现:“英国脱欧”(2019 年)、“冠状病毒”(2020 年)和“新冠疫苗”(2021 年)。因此,在随后的分析中,我们专注于这些主题,对这一话语进行跨国考察。这种选择背后的理由是突出不同国家新闻媒体和用户在报道和消费这些主题方面的差异和相似之处,从而最大限度地减少特定主题的变化对我们分析的影响。此外,这些主题已在欧洲层面得到广泛讨论,这使得我们的分析对于了解不同国家如何看待具有欧洲意义的主题具有重要意义。
为了强调所选三个主题与在线公开辩论的相关性,并验证分配给每个主题的时间范围的准确性,我们对搜索进行了 Google 趋势分析
2019 年至 2021 年法国、德国、意大利和英国对英国脱欧、冠状病毒和新冠疫苗的兴趣,如图 2 所示。
Google Trends 的分析证实,所选主题在更广泛的在线环境中的指定时间范围内引起了最高关注。因此,展望未来,我们的分析将重点关注这三个主题(英国脱欧、冠状病毒和新冠疫苗),以研究欧洲新闻制作和消费的差异和相似之处。为了专门针对这些主题进行分析,我们过滤了新闻媒体的时间线,以仅选择相应时间范围内与所选主题相关的推文(有关详细信息,请参阅第 2 节)。
我们继续研究,比较社交媒体平台上与已确定主题相关的内容的参与度。图 3 显示了按国家/地区划分的推文互动分布,计算为按点赞、转发、引用和回复计算的可靠新闻来源(蓝色)和可疑新闻来源(橙色)(由 NewsGuard 分类,参见第 2 节),针对三个主题中的每一个。尽管地理差异很小,但用户互动的分布在所有三个主题中都显示出类似的长尾分布,其中少数推文获得大量互动,而大多数推文获得很少互动。可靠新闻来源通常比可疑新闻来源获得更多互动
来源,如 x 轴上它们分布更广泛所示。然而,也观察到一些例外,例如英国在 COVID-19 疫苗讨论中的情况和法国在冠状病毒辩论中的情况。此外,在英国脱欧讨论中,可疑消息来源在德国和意大利的分布尾部占有明显地位,尽管在其他讨论中它们并不那么突出。总体而言,可疑消息来源的存在及其产生的参与度可能会有所不同,这取决于国家和所讨论的具体主题。
然后,我们将注意力转向新闻消费模式,以突出新闻媒体受众的差异和相似之处。通过分析英国脱欧、冠状病毒和新冠疫苗的 Twitter 数据,我们探索同一类型的新闻媒体是否有相似的受众。我们根据转发者的余弦相似度(见第 2 节)定义了一个指标,以量化新闻媒体在受众方面的相似性。转发者共享比例较高的新闻媒体的相似度指标值较高(接近 1),而转发者共享比例较低的新闻媒体的相似度指标值较低(接近 0)。
然后,我们构建一个无向网络,其中新闻媒体表示为节点,加权边表示它们之间的相似度。我们为每个国家和主题创建一个网络,以便进行公平比较。结果网络如图 4 所示。为了仅突出显示较强的连接,我们丢弃权重低于每个网络边的总体中位数的边(完整网络的结果请参见 SI 的图 1 和图 2)。
我们可能会观察到网络结构的变化,具体取决于所考虑的国家和主题。事实上,法国、德国和意大利往往显示出一个清晰可辨的可疑来源集群(橙色三角形),表明存在主要消费可疑内容的社区。在英国,这种区别不太明显。通过查看特定主题的差异,我们发现,对于除英国以外的所有国家,在英国脱欧的情况下,网络往往更稀疏,边缘密度更低。对于冠状病毒和 Covid 疫苗讨论,网络连接更紧密,边缘密度更高(见 SI 表 2)。这反映在可疑新闻来源和可靠新闻来源之间的分离上:在英国脱欧辩论中,两种新闻类型之间的分离似乎更清晰,而在其他辩论中,它们共享更多连接,如 SI 表 3 所示。为了进一步量化这种行为,我们将调整后的名义分类性应用于我们的网络(Karimi 和 Oliveira,2022 年),表明在英国脱欧辩论的背景下实现了更高水平的分类性。不过,英国表现出不同的行为,这可能是因为它直接参与了这场辩论。
我们的分析还表明,可疑新闻和可靠新闻之间没有绝对的区分。这表明一些用户主要或专门消费可靠或可疑内容,而其他用户则混合消费新闻,以不同的比例消费两种类型的新闻。为了深入研究这个问题,我们分析了每个用户消费的可疑新闻的比例,并在图 5 中展示了分布情况。结果表明,每场辩论中的大多数用户主要依赖可靠的新闻来源(另见 SI 的表 4)。然而,在每场辩论中,都有一小部分但明显的用户专门支持可疑新闻,尽管突出程度各不相同。值得注意的是,该图描绘了一个独特的双峰分布,很少有用户落在频谱的两端之外。这些用户在相似网络中弥合可疑新闻和可靠新闻之间的差距方面发挥着至关重要的作用。此外,可靠的新闻来源往往占据网络的核心,而可疑来源通常位于更边缘的位置。事实上,在每个网络中 PageRank 算法确定的前 25 个来源中(Bakshy 等人,2011),绝大多数(至少 95.3%)被发现是可靠的新闻来源(有关详细信息,请参阅 SI)。我们通过检查相似性网络的社区结构来总结我们的分析。我们使用 Louvain 聚类进行社区检测
算法(Blondel 等人,2008)并在图 6 中报告结果。根据可疑新闻媒体的比例对聚类进行颜色编码,颜色越深,表示可疑来源的百分比越高。
在所有国家和主题中,大多数集群主要由可靠的新闻媒体组成,在这些集群中,我们还根据 PageRank 分类找到了最重要的节点。然而,我们的分析还揭示了存在一些小型集群,其中可疑新闻媒体的比例很高。这些集群的数量和大小因国家和主题而异。例如,在德国和意大利,每个主题都有一个这样的集群,而在法国的英国脱欧辩论中,有两个集群。在英国,这种分离不太明显,没有集群显示可疑新闻媒体的比例很高。我们还注意到,可靠的集群往往规模较小但数量较多,而可疑集群往往较大,并且在每个网络中通常是独一无二的。这表明,消费可疑内容的用户倾向于认可网络中大多数可疑来源,而可靠的新闻消费者则关注较少的新闻媒体。
总体而言,我们的分析提供了所选国家/地区在线新闻消费格局的纵向视图,突出了可靠新闻来源的主导地位,同时也揭示了许多国家/地区和主题中存在可疑新闻来源比例较高的集群。此类集群的存在表明存在一群用户,他们消费来自各种可疑来源的内容,同时避免使用可靠来源。这种行为与回音室的潜在存在相一致,回音室是在线辩论中广泛观察到的一种现象(Cinelli 等人,2021 年;Falkenberg 等人,2022 年;Cota 等人,2019 年)。