paint-brush
Clasificación multilingüe de posturas políticas generales de los medios: resumen y conclusionespor@mediabias
111 lecturas

Clasificación multilingüe de posturas políticas generales de los medios: resumen y conclusiones

Demasiado Largo; Para Leer

En este artículo, los investigadores analizan la neutralidad de los artículos de noticias generados por IA y la evolución de la postura en todos los idiomas utilizando calificaciones auténticas de los medios de comunicación.
featured image - Clasificación multilingüe de posturas políticas generales de los medios: resumen y conclusiones
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Este documento está disponible en arxiv bajo licencia CC BY-NC-SA 4.0 DEED.

Autores:

(1) Cristina España-Bonet, DFKI GmbH, Campus de Informática del Sarre.

Tabla de enlaces

4. Resumen y conclusiones

Los medios de comunicación tienen una línea editorial y un sesgo asociado. Deshacernos de los sesgos políticos es difícil para los humanos, pero ser conscientes de ellos nos ayuda a tener una visión global de las noticias. Los prejuicios a veces son claros y/o aparecen en forma de texto dañino, pero a veces son sutiles y difíciles de detectar. Estos sutiles prejuicios ocultos son potencialmente peligrosos y conducen a la manipulación siempre que no somos conscientes de ellos. En este trabajo, estudiamos sistemáticamente los sutiles sesgos políticos detrás de ChatGPT y Bard, aquellos que aparecen sin asignar ningún rol de persona (Deshpande et al., 2023). Demostramos que la orientación de ChatGPT cambia con el tiempo y es diferente entre idiomas. Entre febrero y agosto de 2023, ChatGPT pasó de una orientación política de izquierda a neutral, con un período de tendencia de derecha en el medio para inglés y español. La evolución de Bard aún no se puede estudiar. Su versión actual, de agosto de 2023, muestra consistentemente una tendencia izquierdista en los 4 idiomas estudiados. Este sesgo es independiente de los errores fácticos que genera el modelo y también debe ser considerado por sus usuarios. Proporcionamos modelos para comprobar periódicamente el sesgo en las generaciones de textos de EE. UU., Alemania y España, así como en contextos políticos e idiomas estrechamente relacionados, utilizando un enfoque de tiro cero.


Como subproducto de nuestro análisis, creamos un corpus multilingüe de 1,2 millones de artículos periodísticos con anotaciones burdas sobre posturas y temas políticos. Mostramos que la supervisión distante nos permite construir modelos significativos para la clasificación aproximada de posturas políticas siempre que el corpus sea diverso. Estos datos los ponemos a disposición junto con las generaciones de LMs y nuestro código a través de Zenodo (España-Bonet, 2023) y Github.[12]


[12] https://github.com/cristinae/docTransformer