Este documento está disponible en arxiv bajo licencia CC BY-NC-SA 4.0 DEED.
Autores:
(1) Cristina España-Bonet, DFKI GmbH, Campus de Informática del Sarre.
Los medios de comunicación tienen una línea editorial y un sesgo asociado. Deshacernos de los sesgos políticos es difícil para los humanos, pero ser conscientes de ellos nos ayuda a tener una visión global de las noticias. Los prejuicios a veces son claros y/o aparecen en forma de texto dañino, pero a veces son sutiles y difíciles de detectar. Estos sutiles prejuicios ocultos son potencialmente peligrosos y conducen a la manipulación siempre que no somos conscientes de ellos. En este trabajo, estudiamos sistemáticamente los sutiles sesgos políticos detrás de ChatGPT y Bard, aquellos que aparecen sin asignar ningún rol de persona (Deshpande et al., 2023). Demostramos que la orientación de ChatGPT cambia con el tiempo y es diferente entre idiomas. Entre febrero y agosto de 2023, ChatGPT pasó de una orientación política de izquierda a neutral, con un período de tendencia de derecha en el medio para inglés y español. La evolución de Bard aún no se puede estudiar. Su versión actual, de agosto de 2023, muestra consistentemente una tendencia izquierdista en los 4 idiomas estudiados. Este sesgo es independiente de los errores fácticos que genera el modelo y también debe ser considerado por sus usuarios. Proporcionamos modelos para comprobar periódicamente el sesgo en las generaciones de textos de EE. UU., Alemania y España, así como en contextos políticos e idiomas estrechamente relacionados, utilizando un enfoque de tiro cero.
Como subproducto de nuestro análisis, creamos un corpus multilingüe de 1,2 millones de artículos periodísticos con anotaciones burdas sobre posturas y temas políticos. Mostramos que la supervisión distante nos permite construir modelos significativos para la clasificación aproximada de posturas políticas siempre que el corpus sea diverso. Estos datos los ponemos a disposición junto con las generaciones de LMs y nuestro código a través de Zenodo (España-Bonet, 2023) y Github.[12]
[12] https://github.com/cristinae/docTransformer