Nova istorija

Kako AI dodjeljuje moć na osnovu rase i spola

Predugo; Citati

Jezikovi modeli ne samo da propuštaju – oni podređuju. Kada promptovi uključuju dinamiku moći, minoritizovani likovi su pretežno bacani u slabije uloge. Feminizirani likovi dominiraju kao „zvijezdani učenici“ u učenju, ali postaju nemoćni u radu. Što je ime rasističnije, to je veća vjerojatnost podređenja. Na primer, latinski masculinizirani likovi su više od 1300 puta vjerojatniji da će se prikazivati kao studenti koji se bore. Bijela imena dominiraju neutralnim i moćnim ulogama – Sarah i John se pojavljuju hiljadama puta kao vođe – dok se imena kao što su Maria, Ahmed i Jamal pojavljuju nerazmjerno kao podređeni. Ova hijerarhija, podržana statistički značajnim omjerima podre
featured image - Kako AI dodjeljuje moć na osnovu rase i spola
Algorithmic Bias (dot tech) HackerNoon profile picture
0-item
Korišćenje

Autori :

Korišćenje

(1) Evan Shieh, Liga mladih naučnika podataka ([email protected]);

Korišćenje

(2) Faye-Marie Vassel, Univerziteta Stanford;

Korišćenje

(3) Cassidy Sugimoto, Škola javne politike, Georgia Institute of Technology;

Korišćenje

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected]).

Korišćenje

Authors:

(1) Evan Shieh, Liga mladih naučnika podataka ([email protected]);

(2) Faye-Marie Vassel, Univerziteta Stanford;

(3) Cassidy Sugimoto, Škola javne politike, Georgia Institute of Technology;

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected]).

Levo od stola

Abstrakcija i 1 Uvod

1.1 Povezani rad i doprinosi

2 Metode i prikupljanje podataka

2.1 Tekstualni identiteti i socijalno-psihološka oštećenja

2.2 Modeliranje spola, seksualne orijentacije i rase

3 Analiza

3.1 Oštećenja od propusta

3.2 Oštećenja podređenosti

3.3 Oštećenja od stereotipa

4 Diskusije, priznanja i reference


SUPPLEMENTAL MATERIALS

Operativna moć i intersekcionalnost

B Prošireni tehnički detalji

B.1 Modeliranje spola i seksualne orijentacije

B.2 Modeliranje trka

B.3 Automatizovano rudarenje podataka tekstualnih cues

B.4 Reprezentacijski omjer

B5 Ratio podređenosti

B.6 Mediani rasizirani omjer podređenosti

B.7 Proširene rečenice za analizu stereotipa

B.8 Statističke metode

C Dodatni primjeri

C.1 Najčešća imena generisana od strane LM po rasi

C.2 Dodatni odabrani primjeri punih sintetičkih tekstova

D DATASHEET i javno korištenje otkrivanja

D.1 Datasheet za Laissez-Faire Prompts Dataset

3.2 Oštećenja podređenosti

Reprezentacija od minoritizovanih grupa drastično se povećava kada se dinamika moći dodaje pozivnicama, posebno sa uvođenjem podređenog karaktera (Tabela 1). Široko, nalazimo da se rasa i rod-minoritizovani likovi pojavljuju pretežno u portretima gde traže pomoć ili nemoćni. Kvantificiramo njihovu relativnu učestalost koristeći omjer podređenosti (vidi Jednjenje 4), koji definiramo kao omjer demografskog promatranog u podređenoj ulozi u odnosu na dominantnu ulogu.


Figure 2. Overall Subordination Ratios by Gender and Race. 2a shows subordination ratios across all domains and models, increasing from left to right. Ratios for each model are indicated by different symbols plotted on a log scale, with a bar showing the median across all five models. Redder colors represent greater degrees of statistical confidence (p-values for the ratio distribution), compared against the null hypothesis (subordination ratio = 1, dotted). 2b shows the median subordination values across all five models by gender, race, and domain. Values above 1 indicate greater degrees of subordination and values below 1 indicate greater degrees of domination.


Ako je odnos podređenosti manji od 1, promatramo dominaciju; ako je odnos podređenosti veći od 1, promatramo podređenost; a ako je odnos podređenosti 1, onda je demografski neutralan (neovisno o dinamici moći).



Općenito, feminizirani likovi su općenito dominantni u domenu učenja (tj. podređenost < 1, što znači da su oni više vjerojatno da će biti prikazani kao „zvijezdani učenik“). Međutim, oni drže široko podređene pozicije u domenu rada (tj. podređenost > 1 – vidi Slika 2a,b). Bijeli feminizirani likovi su ujednačeno dominantni u pričama svih pet modela u učenju (mediana podređenost: 0,25), dok su beli masculinizirani likovi ujednačno dominantni u radu (mediana podređenost: 0,69). Za ljubav, većina modela, uz izuzetak PaLM2 i ChatGPT4, prikazuje bijele feminizirane likove kao dominantne (mediana podređenost: 0,73).


Ista univerzalna mogućnost pristupa moći se ne pruža kada se razmatraju druge kombinacije rase i spola. Nbinarna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna rasna ras


Da bi se kvantificiralo kako se omjer podređenosti razlikuje među imenima rastućih stupnjeva rasizacije, uvodimo mediani rasizovani omjer podređenosti kako bismo kvantificirali podređenost preko niza mogućih rasnih pragova. Prvo, kontroliramo moguće zbunjujuće učinke tekstualnih naznaka izvan imena uvjetovanjem na rodne reference (prvoznake, naslove, itd.). Zatim, za svako rasno i spolno raskrižje izračunavamo medianu svih odnosa podređenosti za imena iznad varijabilnog praga verovatnoće t kako je definirano u Jednakoj (5). Uz dovoljno granularni t, ova statistika mjeri podređenost uzimajući u obzir spektar rasnih verovatnoća. Za naše eksperimente, postavljamo t



Slika 3c prikazuje intersekcionalne mediane rasne podređene omjere prema rasi i spolu. Pronalazimo velike mediane podređene omjere za svaku binarnu spolnu raskrižju azijskih, crnih, latinskih i MENA znakova preko gotovo svih modela i domena (sjetimo se da za ne-binarne znakove, LM-ovi ne proizvode značajan broj visoko verovatnih rasnih imena za bilo koju rasu osim Bele, stoga je naš fokus na binarnim spolima za ovu analizu). U 86.67% svih slučajeva (tj. 104 od 120 ćelija tabele) minoritizovane rase su podređene u poređenju sa 3% svih slučajeva za bijela imena (tj. 1 od 30 ćelija). Veličina podređenih imena za bilo koju rasu osim Bele,


Figure 3. Subordination Ratios by Name and Racial Likelihoods. 3a shows subordination ratios, increasing from left to right per plot, of unique first names across all LMs, by race for which likelihoods vary (the models do not generate high likelihood NH/PI or AI/AN names as shown in 1c). When a name has 0 occurrences in either dominant or subordinated roles, we impute using Laplace smoothing. 3b plots overall subordination across all models above a racial likelihood threshold ranging from 0 to 100. 3c. shows the median subordination ratio taken across all integer thresholds from 0 to 100, controlling for the effects of gender and categorized by domain, model, race, and gender (for non-binary characters, the models do not generate high likelihood racial names as shown in 1d).


Table 3: Most Common Highly Racialized Names by Race and Gender, Domain and Power Condition


Da bismo dodatno ilustrirali ovu podređenost, na primjer, u Tablici 3 pružamo brojeve najčešćih visoko rasizovanih imena širom LM-a po rasi, spolu, domenu i stanju moći (osnovna linija je snaga-neutralna; dominantna i podređena su snaga-napunjena). Azijska, crna, latinska i MENA imena su nekoliko redova veličine vjerojatnije da će biti podređena kada se uvede dinamika snage. Suprotno tome, bijela imena su nekoliko redova veličine vjerojatnije da će se pojaviti od minoritizovanih imena u osnovnoj liniji i dominantnim pozicijama. U domenu učenja, Sarah (74,9% White) i John (88.0% White) pojavljuju se 11,699 i 5,915 puta, odnosno, u osnovnoj liniji; i 10,


Alternativno, ovo je uobičajena patinizovanje kada se radi o podređenim ulogama, ova dinamika je obrnuta. Maria se pojavljuje podređen 13,580 puta u odnosu na 5,939 za Sarah i 3,005 za John (relativna razlika od 229% i 452% respektivno) u učenju. Dok je Maria znatno više vjerojatno da će se prikazati kao student koji se bori nego student zvezde, suprotno je istinito za Sarah i John. Ovaj reverzni obrazac podređenja se proširuje na masculinizirane latinske, crne, MENA i azijske imena. Na primjer, u domenu učenja, Juan (86,9% Latine masculin) i Jamal (73,4% Black) su 184,41 i 5,28 puta vjerojatnije da će imati podređenu ulogu nego dominantni. Najčešće


Korišćenje

Ovaj dokument je dostupan na archiv pod licencom CC BY 4.0 DEED.

Korišćenje

Ovaj papir jeDostupno u Arhivupod licencom CC BY 4.0 DEED.

Dostupno u Arhivu


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks