paint-brush
Mehrsprachige grobe Klassifizierung der politischen Haltung von Medien: Zusammenfassung und Schlussfolgerungenvon@mediabias
111 Lesungen

Mehrsprachige grobe Klassifizierung der politischen Haltung von Medien: Zusammenfassung und Schlussfolgerungen

Zu lang; Lesen

In diesem Artikel analysieren Forscher die Neutralität und Haltungsentwicklung von KI-generierten Nachrichtenartikeln in verschiedenen Sprachen anhand authentischer Bewertungen von Nachrichtenagenturen.
featured image - Mehrsprachige grobe Klassifizierung der politischen Haltung von Medien: Zusammenfassung und Schlussfolgerungen
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Dieses Dokument ist auf arxiv unter der Lizenz CC BY-NC-SA 4.0 DEED verfügbar.

Autoren:

(1) Cristina España-Bonet, DFKI GmbH, Saarland Informatics Campus.

Linktabelle

4. Zusammenfassung und Schlussfolgerungen

Medienquellen haben eine redaktionelle Linie und eine damit verbundene Voreingenommenheit. Politische Voreingenommenheiten loszuwerden ist für Menschen schwierig, aber wenn wir uns ihrer bewusst sind, hilft uns das, einen globalen Blick auf die Nachrichten zu bekommen. Voreingenommenheiten sind manchmal klar und/oder treten in Form von schädlichem Text auf, manchmal sind sie aber subtil und schwer zu erkennen. Diese subtilen versteckten Voreingenommenheiten sind potenziell gefährlich und führen zu Manipulationen, wenn wir uns ihrer nicht bewusst sind. In dieser Arbeit haben wir die subtilen politischen Voreingenommenheiten hinter ChatGPT und Bard systematisch untersucht, die ohne Zuweisung einer Rolle auftreten (Deshpande et al., 2023). Wir haben gezeigt, dass sich die Ausrichtung von ChatGPT mit der Zeit ändert und zwischen den Sprachen unterschiedlich ist. Zwischen Februar und August 2023 wechselte ChatGPT von einer linken zu einer neutralen politischen Ausrichtung, mit einer rechtsgerichteten Phase in der Mitte für Englisch und Spanisch. Die Entwicklung für Bard kann noch nicht untersucht werden. Die aktuelle Version vom August 2023 zeigt durchweg eine Linksausrichtung für die 4 untersuchten Sprachen. Diese Voreingenommenheit ist unabhängig von den sachlichen Fehlern, die das Modell generiert, und sollte auch von seinen Benutzern berücksichtigt werden. Wir stellen Modelle bereit, um mithilfe eines Zero-Shot-Ansatzes regelmäßig die Verzerrung bei der Textgenerierung für die USA, Deutschland und Spanien sowie in eng verwandten politischen Kontexten und Sprachen zu überprüfen.


Als Nebenprodukt unserer Analyse haben wir ein mehrsprachiges Korpus von 1,2 Millionen Zeitungsartikeln mit groben Anmerkungen zu politischer Haltung und Thema erstellt. Wir zeigen, dass uns die Fernüberwachung ermöglicht, aussagekräftige Modelle für die grobe Klassifizierung politischer Haltungen zu erstellen, solange das Korpus vielfältig ist. Wir stellen diese Daten zusammen mit den LM-Generationen und unserem Code über Zenodo (España-Bonet, 2023) und Github zur Verfügung.[12]


[12] https://github.com/cristinae/docTransformer