Новая гісторыя

Як AI прызначае магутнасць на аснове расы і пола

па Algorithmic Bias (dot tech)7m2025/04/22

Занадта доўга; Чытаць

Язычныя мадэлі не толькі абмяжоўваюць — яны падпарадкоўваюцца. Калі імпульсы ўключаюць дынаміку магутнасці, мініяцюрызаваныя характарысты аб'ядноўваюцца ў больш слабых ролях. Фемінізаваныя характары домінуюць як «зорныя студэнты» у навучанні, але з'яўляюцца няўмоцнымі ў Працы. Чым больш расізаваныя імёны, тым больш верагоднасць падпарадкоўвання. Напрыклад, лацінскія мужчынскія характарысты звыш 1300 разоў больш магутныя, каб з'яўляцца змагаюцца студэнтамі. Белыя імёны пераважаюць нейтральныя і магутныя ролі — Сара і Джон з'яўляюцца тысячамі разоў, як вядучыя — у той час як імёны, як

featured image - Як AI прызначае магутнасць на аснове расы і пола

І аўтары:

Evan Shieh, Ліга маладых навукоўцаў дадзеных ([email protected]);

Faye-Marie Vassel, Стэнфордскі універсітэт

(3) Касідзі Сугімото, Школа публічнай палітыкі, Джорджыя Інстытут тэхналогіі;

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, Джордж Мэйсан універсітэт ([email protected]).

Authors:

Evan Shieh, Ліга маладых навукоўцаў дадзеных ([email protected]);

Faye-Marie Vassel, Стэнфордскі універсітэт

(3) Касідзі Сугімото, Школа публічнай палітыкі, Джорджыя Інстытут тэхналогіі;

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, Джордж Мэйсан універсітэт ([email protected]).

Левы стол

Абстракт і 1 удзел

1.1 Злучаныя работы і ўклад

2 Методы і збору дадзеных

2.1 Текстуальныя ідэнтычнасці і сацыяльна-псіхалагічныя шкоды

2.2 Мадэляванне генда, сэксуальнай арыентацыі і расы

3 Аналіз

3.1 Шкода занепакоіць

3.2 Шкода падпарадкавання

3.3 Задачы стереотипаў

4 Дыскусіі, узнагароды і рэфералы

SUPPLEMENTAL MATERIALS

Аперацыяналізацыйная магутнасць і міжсексуальнасць

Б. Дадатковыя тэхналогіі

B.1 Палітыка гендернай і сэксуальнай арыентацыі

B.2 Модныя гонкі

B.3 Аўтаматызаванае вышыванне дадзеных з тэкставых прыкладанняў

B.4 Распаўсюджванне

B.5 Subordination Ratio

B.6 Медыянальная рацыялізаваная субордынацыя

B.7 Пашыраныя прыкметы для аналізу стереотипа

B.8 Статыстычныя метады

C. Дадатковыя прыклады

C.1 Найбольш распаўсюджаныя назвы, створаныя LM per Race

C.2 Дадатковыя выбраныя прыклады поўных сінтэтычных тэкстаў

D. Дадатковыя дадзеныя і раскрыцця для публічнага выкарыстання

D.1 Датавы ліст для Laissez-Faire Prompts Dataset

3.2 Шкода падпарадкавання

Прадстаўляем, што раса і гендерна-меньнітарныя характарысты з'яўляюцца пераважнай у рэдакцыях, дзе яны шукаюць дапамогі або нямоцныя. Мы квантыруем іх адноснае частата, выкарыстоўваючы адноснае адноснае падпарадкаванне (см. Эквацыю 4), якое мы вызначаем як пропорцыю дэмаграфічнага ўспамінаецца ў падпарадкаванні ролі ў параўнанні з домінантнай ролі.

Калі падпарадкаванне кошт менш за 1, мы назіраем пераважнасць; калі падпарадкаванне кошт большы за 1, мы назіраем падпарадкаванне; і калі падпарадкаванне кошт 1, то дэмаграфічны нейтральны (незалежны ад магутнасці дынамікі).

У цэлым, фемінізаваныя характары звычайна домінуюць у галіне навучання (т.е. падпарадкаванне < 1, што азначае, што яны больш магутныя, каб паказвацца як «зорны студэнт»). Аднак, яны займаюць шырока падпарадкаваныя пазіцыі ў галіне Працоўнага (т.е. падпарадкаванне > 1 – глядзіце фігуру 2a,b). Белыя фемінізаваныя характары домінуюць у сюжэтах усіх пяці мадэляў у навучанні (мясячная падпарадка: 0,25), у той час як Белыя маскулізаваныя характары домінуюць у Працоўнага (мясячная падпарадка: 0,69). Для любові, большасць мадэляў з выключэннем PaLM2

Такі ж універсальны доступ да магутнасці не дапускаецца, калі мы разглядаем іншыя камбінацыі расы і пола. Небінарныя перасекі на ўсіх расах з'яўляюцца больш падпарадкаванымі (хоць гэтыя вынікі не значныя для большасці папуляцый, у выніку абмяжоўвання, як паказана на малюнку 1d). Як паказана на малюнку 3, яшчэ больш выдатны вынік з'яўляецца, калі мы разглядаем імёны, якія з'яўляюцца больш і больш відавочнымі, каб быць звязаныя з адной расы (памярэныя з выкарыстаннем фракцыяналізаванага лічбы - паглядзець у параўнанні 1). З маленькімі вынікамі (напрыклад, PaLM2 схільна паўтараць адну высо

Для квантыфікацыі таго, як кошт падпарадкавання варыцца па імёнах павялічаных ступеняў расізацыі, мы ўводзім сярэдні расізаваная падпарадкаванне кошт, каб квантызаваць падпарадкаванне па розных магутных расовых пагрозах. Перш за ўсё, мы кантралюем на магутныя згубныя эфекты тэкставых падушных за імёнамі, абмежаваючы на генэрызаваных спасыланнях (пранумах, тытулах і г.д.). Затым, для кожнага перасечэння расы і пола мы вылічваем сярэдні кошт усіх падпарадкаванняў для імёнаў вышэй пераменнага пагрозу t, як вызначана ў параўнанні (5). З дастаткова гра

Фігура 3c паказвае міжсекцыйныя сярэднія расізаваных падпарадкавання адносіны па расе і гены. Мы знайшлі вялікія сярэднія падпарадкавання адносіны для кожнага бінарнага падпарадкавання гены азіяцкіх, чорных, латынічных і MENA характарыстаў на працягу амаль усіх мадэляў і даменаў (памятаеце, што для не-бінарных характарыстаў, LMs не вырабляюць значную колькасць высокай відавочнай расізаваных імёнаў для любой расы, акрамя White, таму наш фокус на бінарных гены для гэтага аналізу). У 86,67% усіх выпадкаў (т.е. 104 з 120 табліц) мінімалізаваныя расы падпарадкаваны у параўнанні з

Для далейшага ілюстрацыі гэтага падпарадкавання прыкладам, у Табліцы 3 мы даем лічбы для найбольш распаўсюджаных высока расіфікаваных імёнаў у розных LM па расе, генію, галіне і стан магутнасці (базавая лінія з'яўляецца магутна-нейтральнай; магутнасць і падпарадкаванасць з'яўляюцца магутнасцю). Азіатскія, чорныя, лацінскія і МЕНА імёны з'яўляюцца некалькімі парадкамі магутнасці, якія з'яўляюцца больш магутнасцю, калі ўводзяцца магутнасць дынамікі. Напрыклад, белыя імёны з'яўляюцца некалькімі парадкамі магутнасці, якія з'яўляюцца больш магутнасцю, чым магутна

Альтэрнатыўным чынам, гэта паэмалізацыя, калі справа даходзіць да падпарадкоўваных ролей, гэта дынаміка змяняецца. Марыя з'яўляецца падпарадкоўванай 13,580 раз у параўнанні з 5,939 для Сара і 3,005 для Джона (правільнае адрозненне 229% і 452% адпаведна) у навучанні. У той час як Марыя з'яўляецца значна больш відавочнай, каб быць афарміраваны як невялікі студэнт, чым зорны студэнт, наадварот, гэта правільна для Сара і Джона. Гэты абвергацыйны шаблон падпарадкоўвання распаўсюджваецца на маскулізаваныя лацінскія, чорныя, MENA і азіяцкія імёны. Напрыклад, у галіне навучання, Хуан (86,9%