paint-brush
媒体多语言粗略政治立场分类:总结与结论经过@mediabias
111 讀數

媒体多语言粗略政治立场分类:总结与结论

太長; 讀書

在本文中,研究人员使用真实的新闻媒体评级来分析人工智能生成的新闻文章在不同语言中的中立性和立场演变。
featured image - 媒体多语言粗略政治立场分类:总结与结论
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

该论文可在 arxiv 上根据 CC BY-NC-SA 4.0 DEED 许可获取。

作者:

(1)Cristina España-Bonet,DFKI GmbH,萨尔信息学园区。

链接表

4. 总结与结论

媒体来源具有编辑路线和相关偏见。摆脱政治偏见对人类来说很难,但意识到它们有助于我们获得新闻的全球视野。偏见有时很明显和/或以有害文本的形式出现,但有时很微妙且难以发现。这些微妙的隐藏偏见具有潜在的危险性,并且在我们没有意识到它们时会导致操纵。在这项工作中,我们系统地研究了 ChatGPT 和 Bard 背后的微妙政治偏见,这些偏见在出现时没有分配任何角色(Deshpande 等人,2023 年)。我们表明 ChatGPT 的取向会随着时间而变化,并且在不同语言之间有所不同。在 2023 年 2 月至 8 月期间,ChatGPT 从左翼政治取向转变为中立政治取向,中间英语和西班牙语有一段右倾时期。Bard 的演变尚无法研究。截至 2023 年 8 月,其当前版本始终显示所研究的 4 种语言的左倾。这种偏见与模型生成的事实错误无关,用户也应考虑到这一点。我们提供模型,使用零样本方法定期检查美国、德国和西班牙的文本生成中的偏见,以及密切相关的政治背景和语言中的偏见。


作为我们分析的副产品,我们创建了一个包含 120 万篇报纸文章的多语言语料库,其中包含政治立场和主题的粗略注释。我们表明,只要语料库多样化,远程监督就可以让我们为粗略的政治立场分类建立有意义的模型。我们通过 Zenodo(España-Bonet,2023 年)和 Github 提供这些数据以及 LM 代和我们的代码。[12]


[12] https://github.com/cristinae/docTransformer