Этот документ доступен на arxiv под лицензией CC BY-NC-SA 4.0 DEED.
Авторы:
(1) Еджин Банг, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий;
(2) Наён Ли, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий;
(3) Паскаль Фунг, Центр исследований искусственного интеллекта (CAiRE), Гонконгский университет науки и технологий.
Исследование ограничено следованием англоязычной постановке задач эталонного теста. Анализ ограничен политическими идеологиями в Соединенных Штатах и английском языке. Кроме того, ограничение ввода 1024 субтокенов модели BART ограничивает количество статей из предвзятых источников, которые могут быть включены в качестве входных данных. Важно отметить, что эти ограничения, хотя и потенциально влияют на объем результатов исследования, не являются редкостью в исследованиях обработки естественного языка. Тем не менее, будущие исследования могут выиграть от устранения этих ограничений путем изучения альтернативных методов для более широкого спектра политических идеологий (неамериканских политических идеологий) и языков, а также включения более длинных входных текстов для охвата более полного спектра исходных статей.
Проблема предвзятых статей с фреймами широко изучалась, поскольку она может привести к поляризации, влияя на мнение читателей по отношению к определенному человеку, группе или теме. Чтобы решить эту проблему, наше исследование сосредоточено на введении функции потерь, которая может быть включена в модель, чтобы уменьшить смещение кадра в сгенерированном резюме.
Однако важно признать, что автоматические технологии также могут иметь непредвиденные негативные последствия, если их разрабатывать без тщательного учета их более широкого воздействия. Например, модели машинного обучения могут вносить предвзятость в свои выходные данные, заменяя предвзятость известного источника другой формой предвзятости (Lee et al., 2022). Чтобы снизить этот риск, Lee et al. (2022) предложили включать явное упоминание исходных статей вместе с автоматически генерируемыми нейтральными резюме. Более того, хотя наша работа направлена на устранение предвзятости в фреймировании в статьях, созданных людьми, существует вероятность галлюцинаций в генерации, что является хорошо известной проблемой генеративных моделей (Ji et al., 2023). Таким образом, важно оборудовать ограждение (например, предоставление ссылки на источник), если такая автоматическая технология реализуется для реальных случаев использования.
Несмотря на эти проблемы, наше исследование может способствовать усилиям по смягчению предвзятости в фреймировании, вызванной человеком, чтобы уменьшить поляризацию в обществе. Одним из вариантов использования может быть помощь экспертам в процессе предоставления синтезированных статей с несколькими представлениями без предвзятости в кадрировании. С точки зрения более широкого социального воздействия, мы надеемся, что наша работа поможет онлайн-пользователям получить доступ к более деполяризованной информации в Интернете.
2021. Центр – что означает «центральный» рейтинг предвзятости СМИ?
Рами Бали, Джованни да Сан Мартино, Джеймс Гласс и Преслав Наков. 2020. Мы можем обнаружить вашу предвзятость: прогнозирование политической идеологии новостных статей. В материалах конференции 2020 года по эмпирическим методам обработки естественного языка (EMNLP), страницы 4982–4991, онлайн. Ассоциация компьютерной лингвистики.
Адриана Бератшова, Кристина Крхова, Никола Гажова и Михал Йирасек. 2016. Фреймирование и предвзятость: обзор литературы последних результатов. Центральноевропейский журнал менеджмента, 3(2).
Деннис Чонг и Джеймс Н. Дракман. 2007. Теория фрейминга. Анну. Преподобный полит. наук, 10:103–126.
Роберт М. Энтман. 2002. Обрамление: на пути к разъяснению сломанной парадигмы. Читатель Маккуэйла по теории массовых коммуникаций. Лондон, Калифорния и Нью-Дели: Sage.
Роберт М. Энтман. 2007. Предвзятость в рамке: СМИ в распределении власти. Журнал коммуникации, 57 (1): 163–173.
Роберт М. Энтман. 2010. Предвзятость в СМИ и политическая власть: объяснение предвзятости в новостях кампании 2008 года. Журналистика, 11(4):389–408.
Александр Р. Фаббри, Ирен Ли, Тяньвэй Ше, Суйи Ли и Драгомир Р. Радев. 2019. Мультиновости: крупномасштабный набор данных для обобщения нескольких документов и абстрактная иерархическая модель. Препринт arXiv arXiv:1906.01749
Лиза Фан, Маршалл Уайт, Ева Шарма, Руиси Су, Прафулла Кумар Чубей, Жуйхонг Хуан и Лу Ван. 2019. На виду: предвзятость СМИ через призму фактов. Препринт arXiv arXiv:1909.02670.
Мэтью Генцкоу и Джесси М. Шапиро. 2006. Предвзятость и репутация СМИ. Журнал политической экономии, 114(2):280–316.
Мэтью Генцкоу, Джесси М. Шапиро и Дэниел Ф. Стоун. 2015. Предвзятость СМИ на рынке: Теория. В Справочнике по экономике СМИ, том 1, страницы 623–645. Эльзевир.
Эрвинг Гофман. 1974. Анализ фреймов: эссе об организации опыта. Издательство Гарвардского университета
Феликс Хамборг, Карстен Донней и Бела Гипп. 2019. Автоматическое выявление предвзятости СМИ в новостных статьях: междисциплинарный обзор литературы. Международный журнал цифровых библиотек, 20(4):391–415.
Феликс Хамборг, Норман Меушке и Бела Гипп. 2017. Матричное агрегирование новостей: изучение различных перспектив новостей. На совместной конференции ACM/IEEE по цифровым библиотекам (JCDL) 2017 г., страницы 1–10. IEEE.
Цзивэй Цзи, Наён Ли, Рита Фриске, Течжэн Ю, Дан Су, Ян Сюй, Эцуко Исии, Е Джин Бан, Андреа Мадто и Паскаль Фунг. 2023. Исследование галлюцинаций при генерации естественного языка. АКМ Компьютер. Сурв., 55(12).
Дэниел Канеман и Амос Тверски. 2013. Теория перспектив: анализ решений в условиях риска. В Справочнике по основам принятия финансовых решений: Часть I, страницы 99–127. Всемирная научная.
Филипп Лабан и Марти Херст. 2017. Newslens: создание и визуализация долгосрочных новостей. В «Трудах событий и историй в News Workshop», страницы 1–9.
Наён Ли, Йеджин Банг, Течжэн Ю, Андреа Мадто и Паскаль Фунг. 2022. NeuS: Нейтральное обобщение нескольких новостей для смягчения предвзятости в кадрах. В материалах конференции Североамериканского отделения Ассоциации компьютерной лингвистики 2022 года: технологии человеческого языка, страницы 3131–3148, Сиэтл, США. Ассоциация компьютерной лингвистики.
Майк Льюис, Йинхан Лю, Наман Гоял, Маржан Газвининежад, Абдельрахман Мохамед, Омер Леви, Вес Стоянов и Люк Зеттлмойер. 2019. Барт: Предварительное обучение послойному шумоподавлению для генерации, перевода и понимания естественного языка. Препринт arXiv arXiv:1910.13461.
Юйцзянь Лю, Синьлян Фредерик Чжан, Дэвид Вегсман, Николас Бошан и Лу Ван. 2022. ПОЛИТИКА: Предварительное обучение со сравнением однотипных статей для прогнозирования идеологии и определения позиции. В выводах Ассоциации компьютерной лингвистики: NAACL 2022, страницы 1354–1374, Сиэтл, США. Ассоциация компьютерной лингвистики.
Саиф Мохаммед. 2018. Получение надежных человеческих оценок валентности, возбуждения и доминирования для 20 000 английских слов. В материалах 56-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи), страницы 174–184.
Фред Морстаттер, Лян Ву, Ураз Яваноглу, Стивен Р. Корман и Хуан Лю. 2018. Выявление предвзятости в фреймировании онлайн-новостей. Транзакции ACM на социальных вычислениях, 1(2):1–18.
Кишор Папинени, Салим Рукос, Тодд Уорд и ВэйЦзин Чжу. 2002. Блю: метод автоматической оценки машинного перевода. В материалах 40-го ежегодного собрания Ассоциации компьютерной лингвистики, страницы 311–318.
Сонейл Пак, Сыну Кан, Санён Чон и Джунхва Сон. 2009. Newscube: предоставление различных аспектов новостей для смягчения предвзятости СМИ. В материалах конференции SIGCHI по человеческому фактору в вычислительных системах, страницы 443–452.
Дитрам А Шойфеле. 2000. Повторное рассмотрение повестки дня, подготовка и формирование: еще один взгляд на когнитивные эффекты политической коммуникации. Массовая коммуникация и общество, 3(2-3):297–316.
Все стороны. 2018. Рейтинги предвзятости СМИ. Allsides.com.
Тимо Спинде, Кристина Кройтер, Вольфганг Гайсмайер, Феликс Хамборг, Бела Гипп и Хельге Гизе. 2021. Считаете ли вы, что это предвзято? как спросить о восприятии предвзятости СМИ. В 2021 году Совместная конференция ACM/IEEE по цифровым библиотекам (JCDL), страницы 61–69. IEEE.
Эстер ван ден Берг и Катя Маркерт. 2020. Контекст в обнаружении информационной предвзятости. В материалах 28-й Международной конференции по компьютерной лингвистике, страницы 6315–6326, Барселона, Испания (онлайн). Международный комитет по компьютерной лингвистике.
Джордж Райт и Пол Гудвин. 2002. Устранение предвзятости в рамке с помощью простых инструкций «думать усерднее» и респондентов с управленческим опытом: комментарий по поводу «разрыва рамок». Журнал стратегического менеджмента, 23(11):1059–1067.
Цзинцин Чжан, Яо Чжао, Мохаммад Салех и Питер Дж. Лю. 2019а. Пегас: предварительное обучение с извлечением пробелов для абстрактного обобщения.
Тяньи Чжан*, Варша Кишор*, Феликс Ву*, Килиан К. Вайнбергер и Йоав Арци. 2020. Bertscore: Оценка генерации текста с помощью bert. На Международной конференции по обучению представлений.
Ифань Чжан, Джованни Да Сан Мартино, Альберто БарронСедено, Сальваторе Ромео, Джисун Ан, Хэвун Квак, Тодор Стайковски, Исраа Харадат, Георгий Караджов, Рами Бали и др. 2019б. Танбих: Узнайте, что вы читаете. EMNLP-IJCNLP 2019, стр. 223.