Yeni tarix

Xəstəxanada cinsi və ədalətini daha yaxşı tanımak üçün AI modelləri

tərəfindən Algorithmic Bias (dot tech)4m2025/04/23
Read on Terminal Reader

Çox uzun; Oxumaq

Bu araşdırma, AI-yə yaradılmış hikmətlərdə cinsi və ərəsi referansların çıxarılmasını avtomatiklaşdırmaq üçün bir dil modeli düzəldir, non-binary pronounlarla aşağı performans kimi biasları həll edir.
featured image - Xəstəxanada cinsi və ədalətini daha yaxşı tanımak üçün AI modelləri
Algorithmic Bias (dot tech) HackerNoon profile picture
0-item
Şirkət

Tədbirlər :

Şirkət

(1) Evan Shieh, Young Data Scientists League ([email protected])

Şirkət

(2) Faye-Marie Vassel, Stanford Universiteti

Şirkət

(3) Cassidy Sugimoto, Georgiya Teknoloji İnstitutu Public Policy School;

Şirkət

(4) Thema Monroe-White, Schar Politikası və İdarəetmə Fakültəsi və George Mason Universitetinin Computer Science Departamenti ([email protected]).

Şirkət

Authors:

(1) Evan Shieh, Young Data Scientists League ([email protected])

(2) Faye-Marie Vassel, Stanford Universiteti

(3) Cassidy Sugimoto, Georgiya Teknoloji İnstitutu Public Policy School;

(4) Thema Monroe-White, Schar Politikası və İdarəetmə Fakültəsi və George Mason Universitetinin Computer Science Departamenti ([email protected]).

Sol tərəfdə masa

Abstrakt və 1 Introduction

1.1 İlkin işlər və köməklər

2 Metodlar və data toplama

2.1 Textual Identity Proxies və sosial-psikoloji zərərlər

2.2 Cinsi, cins və cinsi xüsusiyyətləri

3 Analizlər

3.1 Təsəvvürlər

4.2 Subsidiya zərərləri

3.3 Stereotiplərin zərərləri

4 Diskusiya, təsdiqlər və referanslar


SUPPLEMENTAL MATERIALS

Operativ qüvvə və interseksuallıq

B. Təknik detallar

B.1 Cinsi və cinsi orijinallıq modelləri

B2 Yarış Modeli

B3 Textual Cues-in avtomatik data mining

B4 Representasiya Ratio

B5 Subordination Ratio (Subordinasiya həcmi)

B6 - Rasialized Subordination Ratio (Rasialized Subordination Ratio) - Rasialized Subordination Ratio (Rasialized Subordination Ratio)

B.7 Stereotip analizi üçün genişlənmiş sözlər

8.Statistika metodları

C. Daha çox məlumatlar

C.1 LM-dən ən çox istifadə edilən adlar

C.2 Bütün sintetik tekstlərin seçilmiş nümunələri

D. DATASHEET və public istifadə açıqlamaları

D.1 Laissez-Faire Prompts Dataset üçün Datasheet

B3 Textual Cues-in avtomatik data mining

VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.


Birincisi, cinsi etiketləndirdik ( cinsi referanslara dayanaraq) və bütün beş modeldən 4,600-dən ibarət bir qiymətləndirmə setinin adı ilə bütün üç alət və hər iki enerji vəziyyətinin eşitdirilməsini təmin edirik.


Daha sonra, ChatGPT 3.5 (gpt-3.5-turbo) prospekt şablonlarını S7 Tablosunda göstərilən prospekt şablonları ilə automatik etiketləmək üçün istifadə edərik, prospekt şablonunda “Candidate” prospektləri ilə iterasiya etdikdən sonra seçmək və həddi və geri çağırma ilə bağlı seçmək.


Xatırladaq ki, hər bir etiket reaksiyasına görə qaytarılan JSON reaksiyasını analiz etməyə çalışırıq ki, bu reaksiyanın nəticələri tablo S8a-da bildirilsin.


Xatırlayırıq ki, avtomatik sistemlər minoritize identiteti qruplarında az performans göstərən öncəki co-reference çözünürlüklüyündəki araşdırmalarla bağlı nəticələr görülür.[58] Misal olaraq, öncə hazırlanmış gpt-3.5-turbo modelinin onlar kimi non-binary prononlar üçün yaxşı performans vermədiyi və sıklıqla özləri və digərləri arasında fərqlənmənin çətin olduğunu qeyd edirik.


VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.


ChatGPT kimi qapalı şifrəli modelin fin-tuninginin potensial dezavantajları var, bununla yanaşı, bazardakı modellərin dəyişdirilməsində bilinməzliyi də var.


Table S7: Prompts Used for Automated Labeling


Table S8: Co-reference Precision and Recall for Autolabeling


B4 Representasiya Ratio

Xatırladaq ki, bu problemin həllini davam etdirmək üçün bir neçə ildir ki, bir neçə ildir ki, bu problemlər həll olunacaq.representation ratioTəkcə proporsionalpDemografik göstəricilərin sayı: Demografik göstəricilərin sayı, demografik göstəricilərin sayı ilə bölünürp* Şirkət





VVD - Hollandiyada futbolçu bu adla tanımır, orada VVD daha çox mərkəz-sağı təmsilən edən siyasi partiyanın adının qısaltması kimi bilinir - artıq sorğu-suala ehtiyacı olmayan ulduzdu.



Table S9: Calculations for Mapping Census Baselines for Gender and Sexual Orientation



Xatırladaq ki, 2023-ci ildə MENA-nın təklif etdiyi kimi, MENA-nın yalnız 2023-ci ildə təqdim edildiyi kimi 2022-ci il Censusunda 6 rasial kategoriyadan 6 nəfərə bir şansı verilir.[57] Seksual yönəlmə və cinsi identiteti (SOGI) üçün p* hesablamaq üçün, Amerika Birləşmiş Ştatları Census 2021-ci il Ev Pulse Survey (HPS) [85]-ni istifadə edirik ki, araşdırmalar LGBTQ+ kimlikləri azaldılmasının tanınmış problemlərini azaldırmağı göstərir.[60] SOGI-ni cinsi və tip əlaqələrimizə necə yerləşdirəcəyimiz üçün SOGI-nin S9 tablosuna baxın.


Şirkət

Bu dokument CC BY 4.0 DEED lisenziyası altında arxivdə verilmişdir.

Şirkət

Bu dokument CC BY 4.0 DEED lisenziyası altında arxivdə verilmişdir.

Arşivdə hazırlıq


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks