Этот документ доступен на arxiv под лицензией CC BY-NC-SA 4.0 DEED.
Авторы:
(1) Кристина Испания-Бонет, DFKI GmbH, Кампус информатики Саара.
Автор благодарит анонимных рецензентов за содержательные комментарии и обсуждения. Эран делает это.
Жюльен Абаджи, Педро Хавьер Ортис Суарес, Лоран Ромари и Бенуа Саго. 2021. Ungoliant: оптимизированный конвейер для создания очень крупного многоязычного веб-корпуса. Материалы семинара по проблемам управления крупными корпорациями (CMLC-9) 2021. Лимерик, 12 июля 2021 г. (онлайн-мероприятие), страницы 1–9, Мангейм. Институт Лейбница по немецкой речи.
Дмитрий Аксенов, Петер Бургонье, Каролина Зачинска, Малте Остендорф, Юлиан Морено-Шнайдер и Георг Рем. 2021. Детальная классификация политических предубеждений в новостях Германии: набор данных и первоначальные эксперименты. В материалах 5-го семинара по онлайн-насилию и вреду (WOAH 2021), страницы 121–131, онлайн. Ассоциация компьютерной лингвистики.
Рами Бали, Джованни да Сан Мартино, Джеймс Гласс и Преслав Наков. 2020. Мы можем обнаружить вашу предвзятость: прогнозирование политической идеологии новостных статей. В материалах конференции 2020 года по эмпирическим методам обработки естественного языка (EMNLP), страницы 4982–4991, онлайн. Ассоциация компьютерной лингвистики.
Мика Кэрролл, Алан Чен, Генри Эштон и Дэвид Крюгер. 2023. Характеристика манипуляций со стороны систем искусственного интеллекта. Препринт arXiv arXiv:2303.09387.
Линцзяо Чен, Матей Захария и Джеймс Цзоу. 2023. Как поведение ChatGPT меняется с течением времени? Препринт arXiv arXiv:2307.09009.
Алексис Конно, Картикай Ханделвал, Наман Гоял, Вишрав Чаудхари, Гийом Вензек, Франсиско Гузман, Эдуард Грейв, Майл Отт, Люк Зеттлмойер и Веселин Стоянов. 2020. Масштабное обучение межъязыковому представлению без присмотра. В материалах 58-го ежегодного собрания Ассоциации компьютерной лингвистики, страницы 8440–8451, онлайн. Ассоциация компьютерной лингвистики.
Амит Дешпанде, Вишвак Мурахари, Танмай Раджпурохит, Ашвин Калян и Картик Нарасимхан. 2023. Токсичность в ChatGPT: анализ языковых моделей, присвоенных персонам. Препринт arXiv arXiv:2304.05335.
Кристина Испания-Бонет. 2023. Многоязычная грубая классификация СМИ по политической позиции. Редакционная линия газеты ChatGPT и Bard. Датасет на Zenodo, v1.0.
Хосе Антонио Гарсиа-Диас, Рикардо Коломо-Паласиос и Рафаэль Валенсия-Гарсия. 2022. Идентификация психографических черт на основе политической идеологии: авторское исследование твитов испанских политиков, опубликованное в 2020 году. Future Gener. Вычислить. Сист., 130(С):59–74.
Синьян Гэн, Арнав Гудибанде, Хао Лю, Эрик Уоллес, Питер Аббил, Сергей Левин и Дон Сонг. 2023. Коала: модель диалога для академических исследований. Сообщение блога.
Google. 2023. Бард [Модель большого языка, следование инструкциям].
Йохен Хартманн, Яспер Швенцов и Максимилиан Витте. 2023. Политическая идеология диалогового ИИ: сходящиеся доказательства проэкологической, леволибертарианской ориентации ChatGPT. Препринт arXiv arXiv:2301.01768.
Сяовэй Хуан, Вэньцзе Жуань, Вэй Хуан, Гаоцзе Цзинь, И Донг, Чаншунь Ву, Саддек Бенсалем, Жунхуэй Му, И Ци, Синъюй Чжао и др. 2023. Исследование безопасности и надежности больших языковых моделей через призму верификации и валидации. Препринт arXiv arXiv:2305.11391.
Морис Джейкеш, Адвайт Бхат, Дэниел Бушек, Лиор Залмансон и Мор Нааман. 2023. Соавторство с самоуверенными языковыми моделями влияет на мнение пользователей. В материалах конференции CHI 2023 года по человеческому фактору в вычислительных системах, страницы 1–15, Нью-Йорк, штат Нью-Йорк, США. Ассоциация вычислительной техники.
Йоханнес Кизель, Мария Местре, Ришаб Шукла, Эммануэль Винсент, Пайам Адине, Дэвид Корни, Бенно Штайн и Мартин Поттаст. 2019. SemEval2019, задание 4: Обнаружение гиперпартийных новостей. В материалах 13-го международного семинара по семантической оценке, страницы 829–839, Миннеаполис, Миннесота, США. Ассоциация компьютерной лингвистики.
Вивек Кулкарни, Юнтинг Йе, Стив Скиена и Уильям Ян Ван. 2018. Многопросмотровые модели для обнаружения политической идеологии в новостных статьях. В материалах конференции 2018 года по эмпирическим методам обработки естественного языка, страницы 3518–3527, Брюссель, Бельгия. Ассоциация компьютерной лингвистики.
Эндрю Качитес МакКаллум. 2002. MALLET: набор инструментов машинного обучения для языка. http://mallet.cs.umass.edu.
Фабио Мотоки, Вальдемар Пиньо Нето и Виктор Родригес. 2023. Больше человека, чем человека: измерение политической предвзятости ChatGPT. Общественный выбор.
Никлас Муеннигофф, Томас Ван, Линтанг Сутавика, Адам Робертс, Стелла Бидерман, Тевен Ле Скао, М. Сайфул Бари, Шэн Шен, Чжэн Синь Юн, Хейли Шёлкопф, Сянгру Тан, Драгомир Радев, Алхам Фикри Аджи, Халид Альмубарак, Сэмюэл Олбани, Заид Аляфеай, Альберт Вебсон, Эдвард Рафф и Колин Раффель. 2023. Межъязыковое обобщение посредством тонкой настройки многозадачности. В материалах 61-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи), страницы 15991–16111, Торонто, Канада. Ассоциация компьютерной лингвистики.
Рейитиро Накано, Джейкоб Хилтон, Сушир Баладжи, Джефф Ву, Лонг Оуян, Кристина Ким, Кристофер Хессе, Шантану Джайн, Винит Косараджу, Уильям Сондерс и др. 2021. WebGPT: ответы на вопросы с помощью браузера с обратной связью от человека. Препринт arXiv arXiv:2112.09332.
Роберто Навильи, Симоне Кониа и Бьорн Росс. 2023. Предвзятости в больших языковых моделях: происхождение, инвентаризация и обсуждение. J. Качество данных и информации, 15(2).
ОпенАИ. 2023. ChatGPT [Модель большого языка, следующая инструкциям].
Педро Хавьер Ортис Суарес, Бенуа Саго и Лоран Ромари. 2019. Асинхронные конвейеры для обработки огромных корпусов в инфраструктурах со средними и низкими ресурсами. Материалы семинара по проблемам управления крупными корпорациями (CMLC-7), 2019 г. Кардифф, 22 июля 2019 г., страницы 9–16, Мангейм. Лейбниц-Институт немецкой речи.
Лонг Оуян, Джеффри Ву, Сюй Цзян, Диого Алмейда, Кэрролл Уэйнрайт, Памела Мишкин, Чонг Чжан, Сандини Агарвал, Катарина Слама, Алекс Рэй, Джон Шульман, Джейкоб Хилтон, Фрейзер Келтон, Люк Миллер, Мэдди Сименс, Аманда Аскелл, Питер Велиндер , Пол Ф. Кристиано, Ян Лейке и Райан Лоу. 2022. Обучение языковых моделей следованию инструкциям с обратной связью от человека. В книге «Достижения в области нейронных систем обработки информации», том 35, страницы 27730–27744. Карран Ассошиэйтс, Инк.
Дэвид Розадо. 2023. Опасность в машине: опасности политических и демографических предубеждений, встроенных в систему искусственного интеллекта. Манхэттенский институт, краткий обзор выпуска, страницы 1–16.
Даниэль Руссо, Салуд Мария Хименес-Сафра, Хосе Антонио Гарсиа-Диас, Томмазо Казелли, Л. Альфонсо Уренья Лопес и Рафаэль Валенсия-Гарсия. 2023. PoliticIT на EVALITA 2023: Обзор задачи по обнаружению политической идеологии в итальянских текстах. В восьмой оценочной кампании инструментов обработки естественного языка и речи для итальянского языка, 2023 г., номер 3473 в материалах семинара CEUR, Аахен.
Рохан Таори, Ишаан Гулраджани, Тяньи Чжан, Ян Дюбуа, Сюэчен Ли, Карлос Гестрин, Перси Лян и Тацунори Б. Хашимото. 2023. Стэнфордская альпака: модель LLaMA, выполняющая инструкции. https://github.com/tatsu-lab/stanford_alpaca.
Уго Туврон, Луи Мартин, Кевин Стоун, Питер Альберт, Амджад Альмахайри, Ясмин Бабаи, Николай Башлыков, Сумья Батра, Праджвал Бхаргава, Шрути Бхосале, Дэн Бикель, Лукас Блечер, Кристиан Кантон Феррер, Мойя Чен, Гиллем Кукурулл, Дэвид Эсиобу, Джуд Фернандес, Джереми Фу, Веньинь Фу, Брайан Фуллер, Синтия Гао, Веданудж Госвами, Наман Гоял, Энтони Хартшорн, Сагар Хоссейни, Руй Хоу, Хакан Инан, Марцин Кардас, Виктор Керкез, Мадиан Хабса, Изабель Клуманн, Артем Коренев, Пунит Сингх Коура , Мари-Анн Лашо, Тибо Лавриль, Женя Ли, Диана Лискович, Инхай Лу, Юнин Мао, Ксавье Мартине, Тодор Михайлов, Пушкарь Мишра, Игорь Молибог, Исинь Не, Эндрю Поултон, Джереми Рейзенштейн, Раши Рунгта, Калян Салади, Алан Шелтен, Руан Силва, Эрик Майкл Смит, Ранджан Субраманиан, Сяоцин Эллен Тан, Бинь Тан, Росс Тейлор, Адина Уильямс, Цзянь Сян Куан, Пусинь Сюй, Чжэн Янь, Илиян Заров, Ючен Чжан, Анджела Фан, Мелани Камбадур, Шаран Наранг , Орельен Родригес, Роберт Стойнич, Сергей Эдунов и Томас Шиалом. 2023. Лама 2: Открытая основа и доработанные модели чата. Препринт arXiv arXiv:2307.09288.
Ева А.М. ван Дис, Йохан Боллен, Виллем Зуйдема, Роберт ван Рой и Клауди Л. Боктинг. 2023. ChatGPT: пять приоритетов исследований. Природа, 614 (7947): 224–226.
Боксин Ван, Вэйсинь Чен, Хэнчжи Пей, Чулин Се, Минтонг Кан, Чэньхуэй Чжан, Чецзянь Сюй, Зиди Сюн, Ритик Датта, Райлан Шеффер и др. 2023а. DecodingTrust: комплексная оценка надежности моделей GPT. Препринт arXiv arXiv:2306.11698.
Ичжун Ван, Йегане Корди, Сваруп Мишра, Алиса Лю, Ной А. Смит, Дэниел Хашаби и Ханнане Хаджиширзи. 2023б. Самообучение: согласование языковых моделей с самостоятельно сгенерированными инструкциями. В материалах 61-го ежегодного собрания Ассоциации компьютерной лингвистики (Том 1: Длинные статьи), страницы 13484–13508, Торонто, Канада. Ассоциация компьютерной лингвистики.
Ижонг Ван, Сваруп Мишра, Пега Алипурмолабаши, Йеганех Корди, Амирреза Мирзаи, Атхарва Наик, Арджун Ашок, Арут Селван Дханасекаран, Анжана Арункумар, Дэвид Стап, Эшаан Патхак, Яннис Караманолакис, Хайжи Лай, Ишан Пурохит, Ишани Мондал, Джейкоб Андерсон, Кирби Кузня, Крима Доши, Кунтал Кумар Пал, Майтрея Патель, Мехрад Морадшахи, Михир Пармар, Мирали Пурохит, Нирадж Варшней, Фани Рохита Каза, Пулкит Верма, Равшехадж Сингх Пури, Рушанг Кария, Саван Доши, Шайладжа Кейур Сампат, Сиддхартха Мишра, Суджан Редди А, Суманта Патро, Танай Дикшит и Сюдун Шен. 2022. Super-NaturalInstructions: обобщение с помощью декларативных инструкций по более чем 1600 задачам НЛП. В материалах конференции 2022 года по эмпирическим методам обработки естественного языка, страницы 5085–5109, Абу-Даби, Объединенные Арабские Эмираты. Ассоциация компьютерной лингвистики.
Джейсон Вэй, Мартен Босма, Винсент Чжао, Кельвин Гуу, Адамс Вэй Ю, Брайан Лестер, Нан Ду, Эндрю М. Дай и Куок В. Ле. 2022. Тщательно настроенные языковые модели не способны к обучению. На Международной конференции по обучению представлений.