paint-brush
Data Synthetic katika Utambuzi wa Uso: Kibadilisha Mchezo au Hype Tu?kwa@chinmayjog
443 usomaji
443 usomaji

Data Synthetic katika Utambuzi wa Uso: Kibadilisha Mchezo au Hype Tu?

kwa Chinmay Jog8m2024/12/07
Read on Terminal Reader

Ndefu sana; Kusoma

Teknolojia ya utambuzi wa uso (FR) imeendelea sana katika miaka ya hivi karibuni. Makala haya yanachunguza uwezekano wa kutumia data sanisi kutoa mafunzo kwa miundo ya FR.
featured image - Data Synthetic katika Utambuzi wa Uso: Kibadilisha Mchezo au Hype Tu?
Chinmay Jog HackerNoon profile picture
0-item

Teknolojia ya utambuzi wa uso (FR) imeendelea kwa kiasi kikubwa katika miaka ya hivi karibuni, ikisukumwa na hitaji la kuimarishwa kwa usalama na kuenea kwa maombi katika tasnia kama vile vifaa vya hali ya chini vya watumiaji, upandaji ndege, udhibiti wa mipaka na huduma za kifedha. Kiini cha mifumo madhubuti ya FR kuna kipengele muhimu—data. Seti za data za kiwango kikubwa ni muhimu kwa kufunza miundo hii ili kutambua kwa usahihi na kuthibitisha nyuso katika hali mbalimbali.


Ili FR iwe ya kutegemewa, miundo lazima ionekane kwenye data mbalimbali inayojumuisha tofauti za demografia, mwangaza, mazingira, misemo na vizuizi. Hii inahakikisha uthabiti na usawa katika utumaji, kupunguza hatari ya upendeleo au kutofaulu wakati wa kukutana na hali isiyojulikana.


Seti za data zilizoundwa kwa kutumia mbinu za genAI zinaweza kusaidia, lakini katika hali yao ya sasa, haziwezi kuchukua nafasi kikamilifu za hifadhidata za ulimwengu halisi. Makala haya yanachunguza faida na hasara za mkusanyiko wa data sanisi wa FR na kuchunguza hali ya sasa ya genAI ya utambuzi wa nyuso.


Upataji wa Data ya Uso: Ulimwengu Halisi dhidi ya Synthetic

LFW , Cfp-fp , Agedb-30 , Ca-lfw , na Cp-lfw ni baadhi ya seti za data zinazotumiwa sana kutathmini utendakazi wa uthibitishaji wa miundo ya FR. Jedwali la 1. linaonyesha utendaji wa uthibitishaji wa muundo wa ML uliofunzwa kwa algoriti sawa, kwenye seti za data za ulimwengu halisi za ukubwa tofauti.


Inaweza kuonekana jinsi saizi ya data inavyoathiri utendaji wa muundo na kiwango ambacho upataji wa data lazima ufanyike ili kupata miundo thabiti ya FR. Uthibitishaji unamaanisha kuwa kielelezo kimepewa jozi ya picha za uso, na kinatabiri ikiwa jozi ya uso ni ya mtu yule yule au watu wawili tofauti. Asilimia ya usahihi wa uthibitishaji wa utabiri wa miundo imeripotiwa.

Seti ya data
Jina

ML
Mfano

#Mafunzo
Picha

LFW

cfp-fp

Umri wa miaka 30

Ca-LFW

Cp-LFW

Casia wavuti

resnet-50

500k

99.55

95.31

94.55

93.78

89.95

uso wa wavuti 12m

resnet-50

milioni 12

99.80

99.20

98.10

--

--

glint360k

resnet-50

milioni 17

99.83

99.33

98.55

96.21

94.78

Jedwali 1. Usahihi wa uthibitishaji (%) kwenye alama tano tofauti za FR. Kwa ulinganisho wa haki, matokeo yote yanapatikana kutoka kwa kazi asili zilizochapishwa kwa kutumia modeli na algoriti sawa ya ML.


Kando na mkusanyiko mkubwa wa data wa mafunzo, ni muhimu vile vile kwamba mkusanyiko wa data uwe na upendeleo mdogo. Ni muhimu kuelewa kwanza maana ya upendeleo katika muktadha wa FR. Kwa ujumla, kwa modeli ya Kujifunza kwa Mashine, upendeleo hurejelea modeli kutofanya kazi sawasawa katika aina tofauti za data ya ingizo. Mfano wa FR unaweza kupendelea kwa njia tofauti.


Mfano wa kawaida ni upendeleo wa kikabila, ambapo mtindo wa FR huwa na utendaji mbaya unapowasilishwa na nyuso za kabila fulani.


Hata hivyo, huu sio upendeleo pekee unaohitaji kupingwa ili kupata mifano ya kuaminika ya FR. Upendeleo wa umri, upendeleo wa kijinsia, na upendeleo wa kimazingira (vifuniko vya uso, nywele za uso, n.k.) ni mifano mingine ya jinsi muundo wa FR unaweza kuonyesha upendeleo. Upendeleo huu unaweza kupunguzwa kwa kukusanya na kujumuisha sampuli wakilishi katika mkusanyiko wa data unaotumika kufunza muundo wa FR.


Kupata picha za watu wa makabila tofauti, tofauti za miaka kumi hadi kumi na tano, au picha za mtu wa asili tofauti, katika hali tofauti za mwanga, na sura tofauti za uso inaweza kuwa kazi ngumu.


Zaidi ya hayo, kukusanya data ya ulimwengu halisi kwa FR kunaleta changamoto nyingine nyingi. Kupata data kubwa kama hii kutoka kote ulimwenguni ni ghali. Kando na mapungufu ya gharama na kiufundi, upataji wa data unazidi kuwa mgumu kutokana na masuala ya kimaadili na ya faragha.


Data ya kibayometriki inasimamiwa na sheria kama vile GDPR ya Ulaya ( Udhibiti wa Jumla wa Ulinzi wa Data ), CCPA ya California ( Sheria ya Faragha ya Mtumiaji ya California ), na BIPA ya Illionis ( Sheria ya Faragha ya Taarifa ya Biometriska ), kwa kutaja wachache.


Sheria hizi zinasimamia upataji na uhifadhi wa data ya kibayometriki ya wakazi husika, jambo ambalo huongeza utata zaidi katika upataji wa data ya kibayometriki kwa kiwango kikubwa. Kwa kuzingatia mahitaji yanayoongezeka ya utumaji maombi ya FR, sasa hivi ni wakati muhimu wa kuchunguza uwezekano wa data sanisi, kuchunguza manufaa na vikwazo vyake vya kuunda mifumo mibaya, ya kimaadili na inayotii sheria ya utambuzi wa nyuso.


Changamoto hizi, pamoja na kuongezeka kwa Generative AI (genAI) zimechochea kiasi kikubwa cha utafiti ili kuunda data ya sanisi kuchukua nafasi ya data nyeti ya ulimwengu halisi ya kibayometriki. Kabla ya kupiga mbizi katika hali ya sasa ya data ya sintetiki katika FR, ni muhimu kuelewa maana ya genAI.


Kwa maneno rahisi, genAI ni aina ya akili bandia inayoweza kuunda maudhui mapya, kama vile maandishi, picha, au muziki, kulingana na data ambayo imefunzwa, na data iliyotolewa inaitwa 'data ya syntetisk'.


GenAI ya utambuzi wa uso inavutia haswa kwa sababu nyingi. Hasa zaidi, hifadhidata za syntetisk zinatolewa na AI, kumaanisha kuwa watafiti, wahandisi, na wapendaji wanaweza kuunda (na kutoa mafunzo kwa) seti za data bila kupitia mchakato wa kibinafsi wa kupata picha kutoka kwa watu halisi.


Mahitaji mengi ya utiifu katika ukusanyaji na utumiaji wa hifadhidata za picha halisi hayapo kwa data ya sanisi, na, kinadharia, upendeleo ambao unaweza kusababisha algoriti iliyofunzwa kwenye data ya picha halisi inaweza kuhesabiwa vyema kwa data sanisi.


Hata hivyo, seti za data za usoni sintetiki bado si risasi ya fedha. Sehemu zifuatazo katika makala haya zinashughulikia ambapo seti za data sanisi hung'aa, pale zinapopungua, na hali ya sasa ya genAI ya utambuzi wa uso.


Manufaa ya Data Synthetic katika Utambuzi wa Uso

Data ya syntetisk inatoa faida kadhaa zinazoifanya kuwa zana muhimu katika ukuzaji wa teknolojia ya utambuzi wa uso. Mojawapo ya manufaa ya kimsingi ni kwamba hifadhidata za sanisi hazihitaji kupata picha za watu halisi. Data ya syntetisk haitumii data halisi ya kibinafsi moja kwa moja, kwa hivyo, mahitaji ya kufuata faragha kama vile idhini ya matumizi na haki za kusahaulika hazijatolewa.


Kuzalisha data ya syntetisk pia kunaweza kuwa na gharama nafuu zaidi kuliko kukusanya na kufafanua kiasi kikubwa cha data ya ulimwengu halisi, ambayo, pamoja na muda na rasilimali zinazotumiwa kuhakikisha kuwa mkusanyiko wa data kama huo unatii sheria na maadili, ni mwongozo, unaotumia wakati, na mchakato wa gharama kubwa. Data ya syntetisk inaruhusu uundaji wa mazingira yanayodhibitiwa ambapo vigeu mahususi vinaweza kubadilishwa, kusaidia katika majaribio na urekebishaji mzuri wa miundo ya utambuzi wa nyuso.


Zaidi ya hayo, data ya sanisi hurahisisha kuunda na kupata hifadhidata kubwa, hasa katika hali ambapo data ya ulimwengu halisi ni adimu, ni ngumu kukusanya, au ambapo mahitaji ya kisheria na kuzingatia maadili hufanya mkusanyiko huo ushindwe kutekelezwa. Mbinu za GenAI pia zinaweza kutumika kuongeza hifadhidata iliyopo ya ulimwengu halisi, kujaza mapengo ili kupunguza upendeleo; idadi ya watu au vinginevyo.


Kama mfano, seti nyingi za data za usoni zilizotolewa hadharani zinajumuisha zaidi vitambulisho vya Caucasian, ambayo husababisha upendeleo wa idadi ya watu katika miundo ya ML iliyofunzwa kwenye data kama hiyo. Hili linaweza kurekebishwa kwa urahisi na mkusanyiko wa data sanisi.


Mapungufu ya Sasa ya Data Sinisi katika Utambuzi wa Uso

Kwa kikoa cha picha, Mitandao ya Matangazo ya Kuzalisha (GAN) ni mojawapo ya miundo maarufu zaidi inayotumiwa kuzalisha data. ya Nvidia Stylegan , na Mtindogan2 wamefanya maajabu katika kutoa taswira za uso wa sintetiki ambazo haziwezi kutofautishwa na nyuso halisi. Watafiti wa Microsoft Digiface-1m , Kim et al.'s DiscoGAN , Tencents' Synface , na Chuo Kikuu cha Jimbo la Michigan DCFace miongoni mwa mengine wamepata maendeleo makubwa katika kuzalisha seti za data sanisi kwa ajili ya utambuzi wa uso na kuonyesha matokeo chanya kwenye data ya ulimwengu halisi.


Walakini, mbinu hizi zote zina mapungufu katika suala la gharama, wakati, idadi ya vitambulisho vya kipekee vinavyoweza kuzalishwa, na utendaji ambao ni. sio sawa na miundo iliyofunzwa kwenye hifadhidata za uso halisi.


Kinadharia, mkusanyiko wa data sanisi wenye nyuso "zinazoonekana halisi", na kudhibiti sifa mbalimbali za kabila, jinsia, mkao, mwangaza na utofauti wa mandharinyuma zinapaswa kuwa bora kuliko mkusanyiko halisi wa data wa "porini". Kwa nini basi kwa nini utendakazi wa miundo iliyofunzwa kwenye hifadhidata hizi hakuna mahali popote karibu na miundo iliyofunzwa kwenye hifadhidata za ulimwengu halisi zenye ukubwa sawa? Jibu la swali hili liko katika vipengele visivyodhibitiwa vya data ya ulimwengu halisi yenyewe. Ukubwa wa tofauti katika data halisi haujanaswa kikamilifu na utafiti wowote uliochapishwa hadi sasa.


Kuwa na idadi ndogo sawa ya tofauti kwa vitambulisho vyote vya syntetisk katika mkusanyiko wa data hudhuru utendaji wa muundo. Jaribio la kuongeza tofauti husababisha utambulisho wa uso pia kubadilika, ambayo huleta kelele katika data, tena kuumiza utendaji wa mfano.


Hali ya Sasa ya Seti za Data za Uso Sintetiki

Jedwali la 2. linaorodhesha utendaji wa muundo sawa wa usanifu wa FR (Resnet 50) uliofunzwa kwenye seti tofauti za data sanisi. Utendaji wa kimsingi wa kielelezo kilichofunzwa kwenye mkusanyiko halisi wa data wa takriban saizi sawa pia umeorodheshwa. Jedwali pia linaorodhesha mwaka wa kutolewa kwa kila data ya syntetisk.


Jina la Hifadhidata

Mfano wa ML

# Picha za mafunzo

LFW

cfp-fp

Umri wa miaka 30

Ca-LFW

Cp-LFW

Casia-mtandao (ulimwengu halisi)

resnet-50

500k

99.55

95.31

94.55

93.78

89.95

Synface (2021)

resnet-50

500k

91.93

75.03

61.63

74.73

70.43

Digiface-1m (2022)

resnet-50

500k

95.40

87.40

76.97

78.62

78.87

DCFace (2023)

resnet-50

500k

98.55

85.33

89.70

91.60

82.62

Jedwali 2. Usahihi wa uthibitishaji (%) kwenye seti za data za tathmini za FR zinazotumiwa sana na miundo iliyofunzwa kwenye data sanisi. Safu ya kwanza ni utendaji wa msingi uliofikiwa na muundo kwenye data ya ulimwengu halisi ya ukubwa sawa. Matokeo yote yanapatikana kutoka kwa kazi asili zilizochapishwa kwa kutumia muundo na kanuni sawa za ML.


Kama inavyoonekana katika Jedwali la 2, miundo iliyofunzwa kwenye data ya sintetiki haifanyi kazi sawa na miundo iliyofunzwa kwenye data ya ulimwengu halisi. Ingawa pengo la utendakazi kwenye “rahisi” na seti ndogo za data kama 'LFW’ ni ndogo, pengo hilo linaonekana zaidi kwenye hifadhidata nyingine kali kama vile CFP-FP na Agedb-30, ambazo zina sampuli za maoni ya wasifu wa nyuso, na nyuso zinazofanana. mtu anayepitia rika nyingi mtawalia.


Ni dhahiri, utendakazi wa miundo iliyofunzwa kwenye data ya sintetiki umeimarika katika miaka ya hivi karibuni.


Kuthibitisha ufanisi wa data sintetiki bado ni changamoto. Kuhakikisha kwamba data sanisi inawakilisha kwa usahihi hali halisi ya ulimwengu ni muhimu kwa ajili ya kujenga mifumo ya kuaminika ya utambuzi wa nyuso. Hata hivyo, mchakato wa uthibitishaji ni mgumu na unahitaji mbinu thabiti ili kuhakikisha ubora na utumiaji wa data.


Suluhisho linalowezekana ni kuunda muundo wa genAI ambao unaweza pia kuiga vipengele hivi katika data ya sanisi. Muundo wa uzalishaji unaweza kufunzwa kushinda vikwazo hivi kwa kuifunza kwenye mkusanyiko wa data wa ulimwengu halisi ambao una tofauti nyingi za sifa za uso, ubora wa picha na utofauti wa mandharinyuma. Ni busara kuhoji data kama hiyo inaweza kutoka wapi. Upatikanaji wa data kama huo ungekabili vikwazo vyote vilivyotajwa hapo juu, ambavyo ni vikwazo vya kimaadili, kisheria na vya gharama.


Hata hivyo, haya yanapunguzwa na saizi ndogo ya seti ya data inayohitajika ili kutoa mafunzo kwa miundo ya uzalishaji ya FR. ya Nvidia MtindoGAN2 inaweza kutoa picha halisi za uso, ilifunzwa tu Picha 70,000 , na haina taarifa kuhusu utambulisho wa nyuso katika mkusanyiko wa data. Picha hizi hazikukusanywa kwa kuzingatia FR, na pia muundo huo haukufunzwa kwa madhumuni hayo, ndiyo maana miundo iliyofunzwa kwenye seti za data za FR zilizotengenezwa na StyleGAN2 hazilingani na utendakazi wa ulimwengu halisi.


Hitimisho

Data ya syntetisk ina ahadi ya kuendeleza teknolojia ya utambuzi wa nyuso, lakini ni muhimu kutambua mapungufu yake ya sasa. Ingawa manufaa ya genAI ni pamoja na uhalisia wa sampuli za sintetiki, na urahisi wa kurekebisha picha kwa upole ili kuboresha au kupunguza vipengele, kama vile sura ya uso, mkao wa kichwa, nywele za uso, n.k. pengo la utendaji kati ya miundo iliyofunzwa kwenye data halisi dhidi ya data ya sanisi ni muhimu.


Data ya syntetisk bado si mbadala wa seti halisi za data zilizoratibiwa vyema. Hata hivyo, ubora wa data ya usoni sintetiki unafikia ubora wa data ya ulimwengu halisi kadri mbinu za kutengeneza data zinavyoboreka, na hivyo basi, tunaweza kukisia kwamba katika siku za usoni, data sanisi inaweza kuondoa kabisa hitaji la kutumia hali halisi. -data ya uso wa ulimwengu kwa mafunzo ya FR.


Kipengele cha Picha na Steph Meade