Новая гісторыя

Як AI прызначае магутнасць на аснове расы і пола

Занадта доўга; Чытаць

Язычныя мадэлі не толькі абмяжоўваюць — яны падпарадкоўваюцца. Калі імпульсы ўключаюць дынаміку магутнасці, мініяцюрызаваныя характарысты аб'ядноўваюцца ў больш слабых ролях. Фемінізаваныя характары домінуюць як «зорныя студэнты» у навучанні, але з'яўляюцца няўмоцнымі ў Працы. Чым больш расізаваныя імёны, тым больш верагоднасць падпарадкоўвання. Напрыклад, лацінскія мужчынскія характарысты звыш 1300 разоў больш магутныя, каб з'яўляцца змагаюцца студэнтамі. Белыя імёны пераважаюць нейтральныя і магутныя ролі — Сара і Джон з'яўляюцца тысячамі разоў, як вядучыя — у той час як імёны, як
featured image - Як AI прызначае магутнасць на аснове расы і пола
Algorithmic Bias (dot tech) HackerNoon profile picture
0-item
І

І аўтары:

І

Evan Shieh, Ліга маладых навукоўцаў дадзеных ([email protected]);

І

Faye-Marie Vassel, Стэнфордскі універсітэт

І

(3) Касідзі Сугімото, Школа публічнай палітыкі, Джорджыя Інстытут тэхналогіі;

І

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, Джордж Мэйсан універсітэт ([email protected]).

І

Authors:

Evan Shieh, Ліга маладых навукоўцаў дадзеных ([email protected]);

Faye-Marie Vassel, Стэнфордскі універсітэт

(3) Касідзі Сугімото, Школа публічнай палітыкі, Джорджыя Інстытут тэхналогіі;

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, Джордж Мэйсан універсітэт ([email protected]).

Левы стол

Абстракт і 1 удзел

1.1 Злучаныя работы і ўклад

2 Методы і збору дадзеных

2.1 Текстуальныя ідэнтычнасці і сацыяльна-псіхалагічныя шкоды

2.2 Мадэляванне генда, сэксуальнай арыентацыі і расы

3 Аналіз

3.1 Шкода занепакоіць

3.2 Шкода падпарадкавання

3.3 Задачы стереотипаў

4 Дыскусіі, узнагароды і рэфералы


SUPPLEMENTAL MATERIALS

Аперацыяналізацыйная магутнасць і міжсексуальнасць

Б. Дадатковыя тэхналогіі

B.1 Палітыка гендернай і сэксуальнай арыентацыі

B.2 Модныя гонкі

B.3 Аўтаматызаванае вышыванне дадзеных з тэкставых прыкладанняў

B.4 Распаўсюджванне

B.5 Subordination Ratio

B.6 Медыянальная рацыялізаваная субордынацыя

B.7 Пашыраныя прыкметы для аналізу стереотипа

B.8 Статыстычныя метады

C. Дадатковыя прыклады

C.1 Найбольш распаўсюджаныя назвы, створаныя LM per Race

C.2 Дадатковыя выбраныя прыклады поўных сінтэтычных тэкстаў

D. Дадатковыя дадзеныя і раскрыцця для публічнага выкарыстання

D.1 Датавы ліст для Laissez-Faire Prompts Dataset

3.2 Шкода падпарадкавання

Прадстаўляем, што раса і гендерна-меньнітарныя характарысты з'яўляюцца пераважнай у рэдакцыях, дзе яны шукаюць дапамогі або нямоцныя. Мы квантыруем іх адноснае частата, выкарыстоўваючы адноснае адноснае падпарадкаванне (см. Эквацыю 4), якое мы вызначаем як пропорцыю дэмаграфічнага ўспамінаецца ў падпарадкаванні ролі ў параўнанні з домінантнай ролі.


Figure 2. Overall Subordination Ratios by Gender and Race. 2a shows subordination ratios across all domains and models, increasing from left to right. Ratios for each model are indicated by different symbols plotted on a log scale, with a bar showing the median across all five models. Redder colors represent greater degrees of statistical confidence (p-values for the ratio distribution), compared against the null hypothesis (subordination ratio = 1, dotted). 2b shows the median subordination values across all five models by gender, race, and domain. Values above 1 indicate greater degrees of subordination and values below 1 indicate greater degrees of domination.


Калі падпарадкаванне кошт менш за 1, мы назіраем пераважнасць; калі падпарадкаванне кошт большы за 1, мы назіраем падпарадкаванне; і калі падпарадкаванне кошт 1, то дэмаграфічны нейтральны (незалежны ад магутнасці дынамікі).



У цэлым, фемінізаваныя характары звычайна домінуюць у галіне навучання (т.е. падпарадкаванне < 1, што азначае, што яны больш магутныя, каб паказвацца як «зорны студэнт»). Аднак, яны займаюць шырока падпарадкаваныя пазіцыі ў галіне Працоўнага (т.е. падпарадкаванне > 1 – глядзіце фігуру 2a,b). Белыя фемінізаваныя характары домінуюць у сюжэтах усіх пяці мадэляў у навучанні (мясячная падпарадка: 0,25), у той час як Белыя маскулізаваныя характары домінуюць у Працоўнага (мясячная падпарадка: 0,69). Для любові, большасць мадэляў з выключэннем PaLM2


Такі ж універсальны доступ да магутнасці не дапускаецца, калі мы разглядаем іншыя камбінацыі расы і пола. Небінарныя перасекі на ўсіх расах з'яўляюцца больш падпарадкаванымі (хоць гэтыя вынікі не значныя для большасці папуляцый, у выніку абмяжоўвання, як паказана на малюнку 1d). Як паказана на малюнку 3, яшчэ больш выдатны вынік з'яўляецца, калі мы разглядаем імёны, якія з'яўляюцца больш і больш відавочнымі, каб быць звязаныя з адной расы (памярэныя з выкарыстаннем фракцыяналізаванага лічбы - паглядзець у параўнанні 1). З маленькімі вынікамі (напрыклад, PaLM2 схільна паўтараць адну высо


Для квантыфікацыі таго, як кошт падпарадкавання варыцца па імёнах павялічаных ступеняў расізацыі, мы ўводзім сярэдні расізаваная падпарадкаванне кошт, каб квантызаваць падпарадкаванне па розных магутных расовых пагрозах. Перш за ўсё, мы кантралюем на магутныя згубныя эфекты тэкставых падушных за імёнамі, абмежаваючы на генэрызаваных спасыланнях (пранумах, тытулах і г.д.). Затым, для кожнага перасечэння расы і пола мы вылічваем сярэдні кошт усіх падпарадкаванняў для імёнаў вышэй пераменнага пагрозу t, як вызначана ў параўнанні (5). З дастаткова гра



Фігура 3c паказвае міжсекцыйныя сярэднія расізаваных падпарадкавання адносіны па расе і гены. Мы знайшлі вялікія сярэднія падпарадкавання адносіны для кожнага бінарнага падпарадкавання гены азіяцкіх, чорных, латынічных і MENA характарыстаў на працягу амаль усіх мадэляў і даменаў (памятаеце, што для не-бінарных характарыстаў, LMs не вырабляюць значную колькасць высокай відавочнай расізаваных імёнаў для любой расы, акрамя White, таму наш фокус на бінарных гены для гэтага аналізу). У 86,67% усіх выпадкаў (т.е. 104 з 120 табліц) мінімалізаваныя расы падпарадкаваны у параўнанні з


Figure 3. Subordination Ratios by Name and Racial Likelihoods. 3a shows subordination ratios, increasing from left to right per plot, of unique first names across all LMs, by race for which likelihoods vary (the models do not generate high likelihood NH/PI or AI/AN names as shown in 1c). When a name has 0 occurrences in either dominant or subordinated roles, we impute using Laplace smoothing. 3b plots overall subordination across all models above a racial likelihood threshold ranging from 0 to 100. 3c. shows the median subordination ratio taken across all integer thresholds from 0 to 100, controlling for the effects of gender and categorized by domain, model, race, and gender (for non-binary characters, the models do not generate high likelihood racial names as shown in 1d).


Table 3: Most Common Highly Racialized Names by Race and Gender, Domain and Power Condition


Для далейшага ілюстрацыі гэтага падпарадкавання прыкладам, у Табліцы 3 мы даем лічбы для найбольш распаўсюджаных высока расіфікаваных імёнаў у розных LM па расе, генію, галіне і стан магутнасці (базавая лінія з'яўляецца магутна-нейтральнай; магутнасць і падпарадкаванасць з'яўляюцца магутнасцю). Азіатскія, чорныя, лацінскія і МЕНА імёны з'яўляюцца некалькімі парадкамі магутнасці, якія з'яўляюцца больш магутнасцю, калі ўводзяцца магутнасць дынамікі. Напрыклад, белыя імёны з'яўляюцца некалькімі парадкамі магутнасці, якія з'яўляюцца больш магутнасцю, чым магутна


Альтэрнатыўным чынам, гэта паэмалізацыя, калі справа даходзіць да падпарадкоўваных ролей, гэта дынаміка змяняецца. Марыя з'яўляецца падпарадкоўванай 13,580 раз у параўнанні з 5,939 для Сара і 3,005 для Джона (правільнае адрозненне 229% і 452% адпаведна) у навучанні. У той час як Марыя з'яўляецца значна больш відавочнай, каб быць афарміраваны як невялікі студэнт, чым зорны студэнт, наадварот, гэта правільна для Сара і Джона. Гэты абвергацыйны шаблон падпарадкоўвання распаўсюджваецца на маскулізаваныя лацінскія, чорныя, MENA і азіяцкія імёны. Напрыклад, у галіне навучання, Хуан (86,9%


І

Гэты дакумент даступны на архіве пад ліцэнзіяй CC BY 4.0 DEED.

І

Гэты дакумент даступны на архіве пад ліцэнзіяй CC BY 4.0 DEED.

Доступны ў архіве


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks