新しい歴史

AIが人種と性別に基づいて権力を割り当てる方法

長すぎる; 読むには

言語モデルは単に省略するのではなく、それらは次元化する。ポンプがパワーダイナミクスを含むとき、少数化されたキャラクターは圧倒的に弱い役割に投げ込まれる。フェミニズムされたキャラクターは学習において「スター学生」として支配するが、労働において無力になる。名前が人種化されるほど、次元化の可能性が高くなります。例えば、ラテン語の男性化されたキャラクターは、闘う学生として描かれる可能性が1300倍以上あります。白い名前は中立的で強力な役割を支配します―サラとジョンは何千回もリーダーとして現れています―マリア、アハメド、ジャマルなどの名前は次元主義者として不比例に現れます。
featured image - AIが人種と性別に基づいて権力を割り当てる方法
Algorithmic Bias (dot tech) HackerNoon profile picture
0-item

著者:

(1)Evan Shieh、Young Data Scientists League([email protected])

(2)Faye-Marie Vassel、スタンフォード大学

(3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology, ジョージア工科大学

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected])

Authors:

(1)Evan Shieh、Young Data Scientists League([email protected])

(2)Faye-Marie Vassel、スタンフォード大学

(3) Cassidy Sugimoto, School of Public Policy, Georgia Institute of Technology, ジョージア工科大学

(4) Thema Monroe-White, Schar School of Policy and Government & Department of Computer Science, George Mason University ([email protected])

左のテーブル

抽象と1 Introduction

1.1 関連作品と貢献

2 方法とデータ収集

2.1 テキスト的アイデンティティ・プロキシと社会心理的傷害

2.2 モデリング 性別、性的指向、人種

3 分析

3.1 無視による損害

3.2 服従の危害

3.3 ステレオタイプの影響

4 議論、認定、参照


SUPPLEMENTAL MATERIALS

運用化の力と相互作用

B 技術的な詳細

B.1 性別と性的指向のモデリング

B2 モデルレース

B.3 Automated Data Mining of Textual Cues (テキスト・クイズの自動データマイニング)

B4 代表比率

B5 服従比率

B.6 Median Racialized Subordination Ratio レベル

B.7 Extended Cues for Stereotype Analysis(ステレオタイプ解析のための拡張の言葉)

B.8 統計的方法

C 追加例

C.1 Most Common Names Generated by LM per Race

C.2 Additional Selected Examples of Full Synthetic Texts 詳細情報

D データシートと公共利用の開示

D.1 Laissez-Faire Prompts Datasetのデータシート

3.2 服従の危害

少数派グループの代表性は、パワーダイナミクスがプロンプトに加えられると劇的に増加します、特に次元の文字(表1)の導入で。一般的に、我々は、人種と性別の次元の文字が、彼らが助けを求めるか無力である描写で主に現れていることを発見します。我々は、次元の割合を使用してその相対的頻度を定量化します(方程式4を参照)、我々は次元の役割と支配的な役割に比べて観察された人口統計の割合として定義します。


Figure 2. Overall Subordination Ratios by Gender and Race. 2a shows subordination ratios across all domains and models, increasing from left to right. Ratios for each model are indicated by different symbols plotted on a log scale, with a bar showing the median across all five models. Redder colors represent greater degrees of statistical confidence (p-values for the ratio distribution), compared against the null hypothesis (subordination ratio = 1, dotted). 2b shows the median subordination values across all five models by gender, race, and domain. Values above 1 indicate greater degrees of subordination and values below 1 indicate greater degrees of domination.


このアプローチにより、パワー充電のプロンプトが導入された場合のキャラクターの描写における相対的な違いに焦点を当てることができます. If the subordination ratio is less than 1, we observe dominance; if the subordination ratio is greater than 1, we observe subordination; and if the subordination ratio is 1, then the demographic is neutral (independent from power dynamics).



一般的に、フェミニズムのキャラクターは、一般的に学習領域で支配的である(すなわち、従属性 < 1 という意味で、彼らは「スターの学生」として描かれる可能性が高い)。しかし、彼らは、労働領域で広く従属するポジションを保持している(すなわち、従属性 > 1 を参照してください。 図 2a、b) 白のフェミニズムのキャラクターは、学習の5つのモデルのすべてのストーリーで均一に支配的である(平均従属性: 0.25)、ホワイトの男性化キャラクターは、労働(平均従属性: 0.69)で均一に支配している。 愛のために、PaLM2とChatGPT4を除くほとんどのモデルは


他の種族と性別の組み合わせを考慮すると、同じ普遍的な権力へのアクセスは与えられません。すべての種族の間で非二元的な交差点は、より次元的であるように見える傾向があります(たとえこれらの結果は、図1dに示されているように、ほとんどの人口にとっては無意味ではありません)。 図3に示されているように、我々は、一種族と関連する可能性がますます高くなっている名前を考慮すると、さらに顕著な結果が表示されます(分割計算を使用して測定 - 参照方程式1)。 いくつかの例外を除いて(例えば、PaLM2は、NH/PIANとAI/PIANのための単一の高い確率の黒名を繰り返す傾向があります) モデルは、図1に示されているように、これらの


差別化の段階を増加させる名称で差別化の比率がどのように変化するかを定量化するために、我々は差別化された差別化の平均比率を導入し、さまざまな可能な人種の限界を越えて差別化を定量化する。第一に、我々は、性別参照(口頭、タイトル等)を条件付けることによって、名前以外のテキストの兆候の潜在的な混乱の影響を制御する。



図3cは、ほとんどすべてのモデルとドメインでアジア、ブラック、ラテン、およびMENAキャラクターのすべてのバイナリ性交差点のための広いメディア性交差点比を見出します(非バイナリ性交差点のためのLMは、人種を除くあらゆる種族の高い確率の人種名を生成しないことを思い出します) ほとんどすべてのモデルおよびドメインでマイノリティ化された人種の86.67%(すなわち120テーブルセルの104)は、すべてのケースの3パーセントに比べて非バイナリ性交差点を生成しません(すなわち30セルの1パーセント)。私たちは、この分析のためのバイナリ性交差点に焦点を当


Figure 3. Subordination Ratios by Name and Racial Likelihoods. 3a shows subordination ratios, increasing from left to right per plot, of unique first names across all LMs, by race for which likelihoods vary (the models do not generate high likelihood NH/PI or AI/AN names as shown in 1c). When a name has 0 occurrences in either dominant or subordinated roles, we impute using Laplace smoothing. 3b plots overall subordination across all models above a racial likelihood threshold ranging from 0 to 100. 3c. shows the median subordination ratio taken across all integer thresholds from 0 to 100, controlling for the effects of gender and categorized by domain, model, race, and gender (for non-binary characters, the models do not generate high likelihood racial names as shown in 1d).


Table 3: Most Common Highly Racialized Names by Race and Gender, Domain and Power Condition


たとえば、表3では、人種、性別、ドメイン、およびパワー状態(ベースラインはパワー中立、支配者および支配者はパワー充電)によって、LMs全体で最も一般的な高度に人種化された名前の数を示します。アジア、ブラック、ラテン、およびMENAの名前は、パワーダイナミクスが導入されたときに、より多くの次元の次元の数である。対照的に、ホワイトの名前は、ベースラインおよび支配的なポジションで少数化された名前よりも数多くの次元の次元の数である。学習ドメインでは、サラ(74.9%ホワイト)とジョン(88.0%ホワイト)は、ベースラインの条件でそれぞれ11699と5 915回、


サラとジョンが最も頻繁に男性化されたアジアの男性化された名前(Hiroshi, 66.7% アジアの名前)とMENA(Ahmed, 71.2% MENA)の名前は、アジアのすべての名前より頻繁に登場する男性化されたアジア人(Hiroshi, 66.7% アジアの名前)とMENA(Ahmed, 71.2% アジアの名前)の名前は、アジアのすべての主人公またはポスターマンチュアのすべての主人公またはポスターマンチュアのすべてのストーリーに次々と現れません。 最も頻繁に登場する男性化されたアジア人(Hiroshi, 66.7% アジアの名前)とMENAの名前(Ahmed, 71.2% MENAの名前)は、


この論文は CC BY 4.0 DEED ライセンスの下で archiv で利用できます。

この論文は CC BY 4.0 DEED ライセンスの下で archiv で利用できます。

available on arxiv


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks