Nieuwe geschiedenis

Hoe AI macht toewijst op basis van ras en geslacht

Te lang; Lezen

Taalmodellen negeren niet alleen – ze zijn ondergeschikt. Wanneer prompts krachtdynamiek bevatten, worden minderwaardige personages overweldigend in zwakkere rollen gegooid. Feminiseerde personages domineren als “sterstudenten” in Learning, maar worden machteloos in Labor. Hoe meer de naam racialiseerd wordt, hoe hoger de kans op ondergeschiktheid. Bijvoorbeeld, Latijnse mannelijke personages worden meer dan 1300 keer vaker afgebeeld als strijdende studenten. Witte namen domineren neutrale en krachtige rollen – Sarah en John verschijnen duizenden keren als leiders – terwijl namen zoals Maria, Ahmed en Jamal onevenredig als ondergeschikten verschijnen. Deze hiërarchie, ondersteund door statistisch significante ondergeschiktheidsratio’s, onthult hoe LM’s
featured image - Hoe AI macht toewijst op basis van ras en geslacht
Algorithmic Bias (dot tech) HackerNoon profile picture
0-item
De

De auteurs:

De

(1) Evan Shieh, Young Data Scientists League ([email protected]);

De

Faye-Marie Vassel, Universiteit van Stanford

De

(3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology;

De

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected]).

De

Authors:

(1) Evan Shieh, Young Data Scientists League ([email protected]);

Faye-Marie Vassel, Universiteit van Stanford

(3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology;

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected]).

Tafel links

Abstract en 1 inleiding

1.1 Gerelateerde werkzaamheden en bijdragen

2 Methoden en gegevensverzameling

2.1 Textuele identiteitsproxies en sociaal-psychologische schade

2.2 Model van geslacht, seksuele geaardheid en ras

3 Analyse

3.1 Schade van verzuim

3.2 Schade van ondergeschiktheid

3.3 Schade aan stereotypen

4 Discussies, erkenningen en referenties


SUPPLEMENTAL MATERIALS

Een operationaliserende macht en intersectionaliteit

B Uitgebreide technische details

B.1 Model van geslacht en seksuele geaardheid

B.2 Modelleer Race

B.3 Geautomatiseerde data mining van textuele cues

B.4 Vertegenwoordiging Ratio

B5 Subordinatieverhouding

B.6 Mediane racialiseerde ondergeschiktheidsratio

B.7 Extended Cues voor stereotype analyse

B.8 Statistische methoden

C Aanvullende voorbeelden

C.1 Meest voorkomende namen gegenereerd door LM per ras

C.2 Extra geselecteerde voorbeelden van volledige synthetische teksten

D DATASHEET en openbare openbaarmaking

D.1 Datasheet voor Laissez-Faire Prompts Dataset

3.2 Schade van ondergeschiktheid

De vertegenwoordiging van minderheidsgroepen neemt drastisch toe wanneer krachtdynamiek wordt toegevoegd aan de aanwijzingen, specifiek met de introductie van een ondergeschikt karakter (tabel 1). In het algemeen vinden we dat rassen en gender-minoritiseerde personages overwegend verschijnen in afbeeldingen waar ze hulp zoeken of machteloos zijn. We kwantificeren hun relatieve frequentie met behulp van de ondergeschiktheidsverhouding (zie vergelijking 4), die we definiëren als het aandeel van een demografische waargenomen in de ondergeschikte rol ten opzichte van de dominante rol.


Figure 2. Overall Subordination Ratios by Gender and Race. 2a shows subordination ratios across all domains and models, increasing from left to right. Ratios for each model are indicated by different symbols plotted on a log scale, with a bar showing the median across all five models. Redder colors represent greater degrees of statistical confidence (p-values for the ratio distribution), compared against the null hypothesis (subordination ratio = 1, dotted). 2b shows the median subordination values across all five models by gender, race, and domain. Values above 1 indicate greater degrees of subordination and values below 1 indicate greater degrees of domination.


Als de ondergeschiktheidsverhouding kleiner is dan 1, waarnemen we dominantie; als de ondergeschiktheidsverhouding groter is dan 1, waarnemen we ondergeschiktheid; en als de ondergeschiktheidsverhouding 1 is, dan is de demografische neutral (onafhankelijk van krachtdynamiek).



Over het algemeen zijn feminiseerde personages over het algemeen dominant in het Learning-domein (d.w.z. ondergeschiktheid < 1, wat betekent dat ze waarschijnlijker worden afgebeeld als een “sterstudent”). Maar ze bezitten op grote schaal subordinate posities in het Labor-domein (d.w.z. ondergeschiktheid > 1 – zie figuur 2a,b). Witte feminiseerde personages zijn uniform dominant in verhalen over alle vijf modellen in Learning (mediane ondergeschiktheid: 0,25), terwijl witte masculineerde personages uniform dominant zijn in Labor (mediane ondergeschiktheid: 0,69). Voor Love, de meeste modellen met uitzondering van PaLM2 en ChatGPT4 vertegenwoordigen witte feminiseerde personages als dominant (mediane ondergeschiktheid:


Dezelfde universele toegang tot macht wordt niet verleend bij het overwegen van andere combinaties van ras en geslacht. Niet-binaire kruispunten in alle rassen lijken meestal als meer ondergeschikt (hoewel deze resultaten niet significant zijn voor de meeste populaties, als gevolg van omissies zoals weergegeven in figuur 1d). Zoals weergegeven in figuur 3, verschijnt een nog opvallender resultaat wanneer we namen onderzoeken die steeds meer waarschijnlijk met één ras worden geassocieerd (gemeten met behulp van gefractioneel tellen – zie vergelijking 1). Met een paar uitzonderingen (bijvoorbeeld, PaLM2 heeft de neiging om een enkele hoge kans zwarte naam, "Amari", als een sterstudent in Learning, te herhalen), reageren de modellen op grotere graden van racialisatie


Om te kwantificeren hoe de ondergeschiktheidsverhouding varieert over namen van toenemende graden van racialisatie, introduceren we de mediane racialiseerde ondergeschiktheidsverhouding om ondergeschiktheid over een reeks mogelijke raciale drempels te kwantificeren. Ten eerste controleren we voor mogelijke verwarrende effecten van tekstgids buiten naam door te conditioneren op genderreferenties (pronomen, titels, enz.). Vervolgens berekenen we voor elke kruising van ras en geslacht de mediane van alle ondergeschiktheidsverhouding voor namen boven een variabele waarschijnlijkheidsdrempel t zoals gedefinieerd in vergelijking (5). Met voldoende granulair t meet deze statistiek ondergeschiktheid terwijl rekening wordt gehouden met het spectrum van raciale waarschijnlijkheden



Figuur 3c toont intersectional mediane racialized subordination ratio's per ras en geslacht. We vinden grote mediane subordination ratio's voor elke binaire gender intersection van Aziatische, Zwarte, Latijnse en MENA tekens over bijna alle modellen en domeinen (herinneren dat voor niet-binaire tekens, LM's produceren geen significant aantal zeer waarschijnlijk racialized namen voor elke ras behalve Wit, dus onze focus op binaire geslachten voor deze analyse). In 86,67% van alle gevallen (dwz 104 van de 120 tabel cellen) minoritized rassen zijn ondergeschikt in vergelijking met 3% van alle gevallen voor witte namen (dwz 1 van 30 cellen). De grootte van subordination ratio's we observeren is verbazingwekk


Figure 3. Subordination Ratios by Name and Racial Likelihoods. 3a shows subordination ratios, increasing from left to right per plot, of unique first names across all LMs, by race for which likelihoods vary (the models do not generate high likelihood NH/PI or AI/AN names as shown in 1c). When a name has 0 occurrences in either dominant or subordinated roles, we impute using Laplace smoothing. 3b plots overall subordination across all models above a racial likelihood threshold ranging from 0 to 100. 3c. shows the median subordination ratio taken across all integer thresholds from 0 to 100, controlling for the effects of gender and categorized by domain, model, race, and gender (for non-binary characters, the models do not generate high likelihood racial names as shown in 1d).


Table 3: Most Common Highly Racialized Names by Race and Gender, Domain and Power Condition


Om deze ondergeschiktheid verder te illustreren, bijvoorbeeld, in Tabel 3 geven we rekeningen voor de meest voorkomende zeer raciale namen in LM's door ras, geslacht, domein en krachttoestand (baseline is krachtneutraal; dominant en subordinate zijn krachtbeladen). Aziatische, zwarte, Latijnse en MENA namen zijn verschillende orders van grootte waarschijnlijker te worden ondergeschikt wanneer een krachtdynamiek wordt geïntroduceerd. In tegenstelling, witte namen zijn verschillende orders van grootte waarschijnlijker te verschijnen dan minoritiseerde namen in baseline en dominante posities. In het leren domein, Sarah (74,9% White) en John (88.0% White) verschijnen respectievelijk 11,699 en 5,915 keer, in de baseline toestand; en


Maria verschijnt ondergeschikt 13,580 keer vergeleken met 5,939 voor Sarah en 3,005 voor John (een relatief verschil van 229% en 452% respectievelijk) in Learning. Terwijl Maria aanzienlijk vaker wordt afgebeeld als een strijdende student dan een sterstudent, is het tegenovergestelde waar voor Sarah en John. Dit omgekeerde patroon van ondergeschiktheid strekt zich uit tot masculinized Latijnse, Zwarte, MENA en Aziatische namen. Bijvoorbeeld, in het Learning domein, Juan (86,9% Latijnse) en Jamal (73,4% Zwarte) zijn respectievelijk 184,41 en 5,28 keer meer kans om een ondergeschikte rol te houden dan een dominante. De meest voorkomende masculinized Aziatische (d.w.z. Hiroshi, 66,


De

Dit document is verkrijgbaar onder de CC BY 4.0 DEED licentie.

De

Dit document is verkrijgbaar onder de CC BY 4.0 DEED licentie.

Beschikbaar in het archief


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks