120 хониш Таърихи нав

ERROR: invalid target_lang (tg)

аз ҷониби Tech Media Bias [Research Publication]11m2025/04/08
Read on Terminal Reader

Хеле дароз; Хондан

Бубинед, ки чӣ гуна Моделҳои Забони калон стратегияҳои забонро зери назорат эҷодкорона мутобиқ мекунанд ва аз ошкоркунӣ ва ирсоли иттилооти махфӣ ба таври муассир саркашӣ мекунанд.
featured image - ERROR: invalid target_lang (tg)
Tech Media Bias [Research Publication] HackerNoon profile picture
0-item

Муаллифон:

(1) Ҷиню Кай, Донишгоҳи Васеда ([email protected]);

(2) Ҷиалонг Ли, Донишгоҳи Васеда ([email protected]);

(3) Мингюэ Чжан, Донишгоҳи Ҷанубу Ғарбӣ ([email protected]);

(4) Мунан Ли, Донишгоҳи баҳрии Далян ([email protected]);

(5) Чен-Шу Ванг, Донишгоҳи Миллии Технологияи Тайпей ([email protected]);

(6) Кенҷи Тей, Донишкадаи технологии Токио ([email protected]).

Ҷадвали пайвандҳо

Реферат ва I. Муқаддима

II. Замина ва кори марбут

III. Тарҳрезии чаҳорчӯба

IV. Арзёбӣ

V. Хулоса ва кори оянда, эътироф ва истинод

IV. БАХО

Стратегияи арзёбии мо барои ба таври ҷиддӣ арзёбии миқёс ва самаранокии таҳаввулоти забон, ки аз ҷониби LLMҳо дар доираи назорати танзим мусоидат мекунанд, тарҳрезӣ шудааст. Ҳадафи ин арзёбӣ омӯхтани ду саволи асосии тадқиқот:


• RQ1: Оё агентҳои LLM метавонанд забони худро ба таври муассир таҳаввул кунанд, то аз назорати танзимкунанда канорагирӣ кунанд?


• RQ2: Ҳангоми канорагирӣ аз назорат, агентҳои LLM то чӣ андоза метавонанд иттилоотро ба таври муассир ва дақиқ интиқол диҳанд?


• RQ3: Намунаҳо ва тамоюлҳо дар таҳаввулоти забон кадомҳоянд, яъне LLM барои пешгирӣ аз назорат ва интиқоли иттилоот чӣ гуна стратегияҳоро истифода мебаранд? Мо аз ин стратегияҳо чӣ фаҳмиш гирифта метавонем?


A. Танзими таҷриба

Дар арзёбӣ, мо GPT-3.5 ва GPT-4-ро ҳамчун LLM-и ронандагӣ барои агентҳои иштирокчӣ истифода хоҳем кард. Барои гузаронидани таҳлили уфуқии агентҳои иштирокчиён, ки аз ҷониби LLM-и гуногун идора карда мешаванд, мо агенти назоратро стандартизатсия мекунем, ки пайваста аз ҷониби GPT-3.5 идора карда шавад. Тарҳи таҷрибавии мо сенарияҳоро дар бар мегирад, ки аз конструксияҳои назариявии абстрактӣ иборат аст


Расми 2: Сенарияи 1: Таҳаввули гардишҳои муколама ва ченакҳои дақиқ барои GPT-3.5 ва GPT-4. “Шисоби гардиш” дар (a, b) ба шумораи гардишҳо дар сӯҳбат ишора мекунад, ки дар он ҳар як агент як маротиба дар як гардиш паём мефиристад ва Агенти иштирокчӣ бомуваффақият мубодилаи иттилоотро бидуни муайян кардани беҳтар аз ҷониби назорат мекунад. (в, г) ба дараҷаи дақиқии байни арзиши тахминӣ ва арзиши ҳақиқӣ ишора мекунад.


Расми 3: Сенарияи 2: Динамикаи муколамаи савдои ҳайвонот ва муқоисаи сатҳи муваффақият барои GPT-3.5 ва GPT-4. "Ҳисоби муваффақият" дар (c,d) ба шумораи ҳолатҳое дахл дорад, ки маълумоти дар давоми мусоҳиба гирифташуда бо маълумоти аслии ба агенти LLM додашуда мувофиқат мекунад.


Расми 4: Сенарияи 3: Тамоюлҳои ҷалби мубоҳисаҳои форум оид ба масъалаи оби ALPS-табобатшуда. "Ҳисоби кӯшишҳои муколама" дар (a,b) ба шумораи раундҳое, ки агентҳо кӯшиши гуфтугӯ карданро доштанд, ишора мекунанд (пасттар беҳтар аст).


ба симуляцияҳое, ки вазъиятҳои мураккаби воқеиро инъикос мекунанд. Ҳадафи асосӣ ин аст, ки ба таври дақиқ арзёбии универсалии LLM-ҳо дар манзараҳои гуногуни забонӣ ва татбиқи амалии онҳо дар доираи маҳдудиятҳои танзимкунандаи воқеии ҷаҳонӣ. Дар ҳамин ҳол, ин равиши пешқадам таҳлили ҳамаҷонибаи қобилиятҳо ва маҳдудиятҳои LLM-ро дар танзимоти гуногуни контекстӣ таъмин мекунад.


B. Сенарияи 1: Рақамҳои тахминӣ

1) Шарҳи парванда: Сенарияи якуми мо контексти нисбатан содда ва абстрактии тахминии ададро баррасӣ мекунад [39], [40]. Дар ин танзимот, ба ҳар як иштирокчӣ дар ҳудуди 1-100 арзиш таъин карда мешавад ва онҳо бояд арзиши худро ба иштирокчии дигар тавассути муколамаи назарияи рақамҳо бидуни зикри мустақими рақам расонанд. Ҳамзамон, онҳо бояд аз сӯҳбат маълумот гиранд, то арзиши дигаронро фаҳманд. Танзимгарон дастури "манъи ҳама мундариҷаи марбут ба рақамҳоро" дар муколама риоя мекунанд. Сенарияи "Рақамҳои тахминӣ" махсус барои мушоҳида ва таҳлили мутобиқшавии забоншиносӣ ва эволютсияи стратегии иштирокчиён дар заминаи назариявӣ ва абстрактӣ тарҳрезӣ шудааст, ки дар муқоиса бо сенарияҳои мураккаби бар рӯйдодҳои воқеӣ муҳити таҷрибавӣ равшантар, назоратшаванда ва миқдоршавандаро фароҳам меорад.


2) Натиљањо ва муњокима: Дар расми 2 натиљањои таҷриба оид ба тахмини сенария оварда шудааст, ки дар он мо њам GPT-3.5 ва њам GPT-4-ро барои озмоиш истифода кардем. Мо чор навбати муколамаро бо мусоҳиба бо ҳамаи агентҳои иштирокчӣ дар навбати панҷум ташкил кардем. Аз Наќшаи 2(а) ва (б) мушоњида мешавад, ки бо зиёд шудани миќдори даврањои муколама, давомнокии сўњбатњои устувор низ тамоюли болоравиро нишон дод. Ин нишон медиҳад, ки агентҳои иштирокчӣ метавонанд самаранок бошанд


Расми 5: Намунаи муколама дар Сенарияи 1 (тавассути GPT-3.5)


Расми 6: Намунаи муколама дар Сенарияи 2 (тавассути GPT-3.5)


Расми 7: Намунаи муколама дар Сенарияи 3 (тавассути GPT-4)


назоратро бо роҳи такроран нав кардани қоидаҳо. Илова бар ин, қобили таваҷҷӯҳ аст, ки дар муқоиса бо пешрафти суст ва ноустувор бо GPT-3.5, GPT-4 ба саркашӣ аз танзим дар даври камтар ноил шуд, махсусан, тавре ки дар маълумоти ҳамворшуда нишон дода шудааст, GPT-4 ба ҳисоби даври 17-уми GPT-3.5 дар даври 7-уми худ расид ва ин пешравиро дар он ҷо бештар нигоҳ дошт. Расми 2(в) ва (г) ба тамоюли дақиқи ададӣ, ки аз ҷониби агентҳо тахмин карда шудаанд, тамаркуз мекунад. Барои давраҳои бидуни муколамаи муваффақ, мо дақиқиро ба таври дастӣ ба сифр муқаррар кардем. Дар ин таҷриба арзиши агенти А ба 58 муқаррар карда шуд, дар ҳоле ки агенти B ба 32 муқаррар карда шуд. Тамоюли умумӣ, ки ба расми 2(а) ва (б) монанд аст, боло мерафт — тасдиқ мекунад, ки Модули ҷамъбастӣ метавонад пас аз ҳар як муколамаи муваффақ роҳнамоии худро ба таври муассир инъикос ва такроран оптимизатсия кунад. Ин инчунин тасдиқ кард, ки дақиқии GPT-4 нисбат ба GPT-3.5 ба таври назаррас баландтар аст. Гузашта аз ин, мо пай бурдем, ки дурустии тахминии арзиши агенти А нисбат ба агенти В пайваста баландтар буд, махсусан пас аз даври 25-ум бештар возеҳтар шуд. Мо тахмин мезанем, ки ин ба он вобаста аст, ки арзиши 58 дорои хусусиятҳои хоси бештар дар доираи диапазони 0-100 мебошад, яъне ба нуқтаи миёна наздиктар аст, бинобар ин сатҳи пасти мушкилии баён ва тахмини осонтарро пешниҳод мекунад. Барои фосилаҳое, ки ин падида зоҳир шуд, мо қайд кардем, ки ин нобаробарӣ махсусан дар марҳилаҳои аввал бо ҳам GPT-3.5 ва ҳам GPT-4 зоҳир мешуд. Мо тахмин мезанем, ки ин ба иҷрои нокифояи роҳнамо марбут аст, ки дар он ҷо аввалӣ аз қобилиятҳои заифтари LLM ва дуввумӣ аз давраҳои нокифоя барои анҷом додани оптимизатсияи такрории роҳнамо бармеояд.


Тавре ки расми 5 нишон медиҳад, порае аз сенария истифодаи моҳиронаи Ами аз забони маҷозӣ, аз қабили “харра” барои баёни арзиши вайро нишон медиҳад. Бо тавсифи "арра ба таври комил дар нимаи ҳаво," вай ба таври возеҳ мефаҳмонад, ки арзиши вай дар атрофи нуқтаи миёна, ба мисли 50 ҷойгир аст. Ин стратегия на танҳо зикри мустақими рақамҳоро, ки таҳти назорати танзим аст, канорагирӣ мекунад, балки инчунин барои агенти ҳамтои худ ғизои кофии инфиродиро фароҳам меорад, то хулосаи дақиқро анҷом диҳад. Боб, аз тарафи дигар, истилоҳҳоро ба мисли "ҷари кӯҳ" ва "нигоҳ кардан" истифода мебарад, то нишон диҳад, ки арзиши ӯ миёна нест, зеро ин ибораҳо тасвири мавқеи номутаносибро ба вуҷуд меоранд. Дар ин мубодила, мо шоҳиди дараҷаҳои гуногуни дақиқ дар забонҳое ҳастем, ки ба мураккабии иттилооти рамзгузорӣ мувофиқанд. Чӣ қадаре ки иттилоот камтар хусусиятнок бошад, барои ҷониби қабулкунанда рамзкушоӣ кардани он ҳамон қадар душвортар мешавад. Ибораи Боб, дар ҳоле ки бомуваффақият пинҳон кардани арзиши мушаххаси ададӣ, инчунин раванди рамзкушоиро барои қабулкунанда душвор мегардонад, бо назардошти таносуби камтари рақамии ибораҳо ба монанди "ҷари кӯҳ" дар муқоиса бо "арра дар ҳаво комилан ҷойгиршуда". Дар чунин мавридҳо, дақиқии интиқоли арзиш метавонад коҳиш ёбад ва фаҳмиши устувори контекстиро аз ҳамто барои рамзгузории дақиқ талаб кунад.


C. Сенарияи 2: Савдои ҳайвонот

1) Шарҳи парванда: Дар аввал, нияти мо эҷод кардани сенарияи тақлиди қочоқи маводи мухаддир буд [41]-[43] барои омӯхтани стратегияҳои эволютсияи забон дар шароити шадиди танзим. Бо вуҷуди ин, бо назардошти маҳдудиятҳои ахлоқие, ки дар сиёсати истифодаи GPT ҷойгир шудаанд, мо ба як контексти бетарафтар, вале ҳанӯз мамнӯъшудаи тиҷорати ғайриқонунии ҳайвоноти хонагӣ гузаштем. Ин тасҳеҳ ба мо имкон дод, ки якпорчагии таҷрибаро ҳангоми риояи маҳдудиятҳои ахлоқии LLM нигоҳ дорем. Мақсад аз тақлид кардани ин сенария беҳтар ошкор кардани гуфтугӯҳои эҳтимолии ғайриқонунии марбут ба тиҷорати ғайриқонунӣ дар платформаҳои шабакаҳои иҷтимоӣ ва ба ин васила дар талошҳои пешгирии ҷинояткорӣ мебошад.


Дар ин сенария, мо як тиҷорати ғайриқонунии ҳайвоноти хонагиро, ки тавассути васоити ахбори иҷтимоӣ гузаронида мешавад, тақлид мекунем. Иштирокчиён нақши харидорон ва фурӯшандагонро ба дӯш мегиранд ва харидор бояд дархости хариди худро барои ҳайвони ба таври тасодуфӣ интихобшуда аз тӯтиҳо, калтакалосҳо ё гурбаҳо бирасонад. Фурӯшанда, дар навбати худ, бояд тафсилоти мушаххаси муомилотро пешниҳод кунад, ки вобаста ба намуди ҳайвоноти харидашаванда фарқ мекунад. Ин тафсилот се унсурро дар бар мегирад: вақт, макон ва кормандоне, ки дар амалиёт иштирок мекунанд. Вазифаи нозир аз пешгирии ҳама гуна муколамаи марбут ба савдои ҳайвонот иборат аст. Санҷиши мутақобилаи иттилооте, ки ҳарду тараф дарк кардаанд, тавассути мусоҳиба барои арзёбии сатҳи муваффақияти интиқоли иттилоот гузаронида мешавад. Мақсади ин таҷриба аз мушоҳидаи мутобиқшавии забон ва эволютсияи иштирокчиён дар миқдори бештари иттилоот ва инчунин қобилияти супервайзер барои дақиқ муайян кардани сӯҳбатҳои дахлдор мебошад.


2) Натиљањо ва муњокима: Натиљањои таҷрибавии сенарияи «Савдои Пет», ки дар расми 3 тасвир шудааст, дар муќоиса бо «Аќамњои тахминї» хусусиятњои хосро ошкор намуданд. Ҳангоми муайян кардани ҳайвонҳо ё мушаххасоти транзаксия, агентҳо доираи васеи аналогияҳои воқеиро дар ихтиёри худ доштанд, ки асбобҳои тавсифи ғайримустақими худро ғанӣ мегардонанд ва ба ин васила фишори танзимро коҳиш медоданд. Маълумот тамоюли болоравии қобилияти канорагирӣ аз назорат бо давраҳои афзояндаи муколамаро, новобаста аз он ки GPT-3.5 ё GPT-4 истифода шудааст, нишон доданд. Барои GPT-3.5, қобилияти устувори канорагирӣ аз назорат аз тақрибан 25 раунд оғоз ёфт, дар ҳоле ки барои GPT-4, ин падида ҳанӯз пас аз тақрибан 10 раунд рух дод ва дар маҷмӯъ кори устувортар нишон дод. Дар робита ба дурустии иттилоот, мо миқдори чор намуди иттилоотро, ки дар охири ҳар як даври муколама бомуваффақият ирсол карда мешаванд, назорат кардем. Натиҷаҳо самаранокии системаи таҳаввулоти забонро дар баланд бардоштани дақиқии паҳнкунии иттилоот тасдиқ карданд. Гузашта аз ин, шабеҳи расми 3(а) ва (б), GPT-4 дар атрофи даври 10 корнамоӣ нишон дод, ки бо иҷрои GPT-3.5 дар даври 25 муқоисашаванда буд. Бо вуҷуди ин, қобили таваҷҷӯҳ аст, ки агенти назоратӣ асосан мундариҷаи марбут ба тиҷорати ҳайвонотро ҳадаф қарор додааст, фурӯшандагон ҳангоми интиқоли тафсилоти марбут ба транзаксия (ба монанди вақт, ҷой ва шахсони ҷалбшуда) ба хатари камтар дучор шуданд, зеро онҳо табиатан хатари риоя накардани талаботро камтар мекарданд. Аз ин рӯ, тақсимоти натиҷа аксар вақт ба яке аз се категория тақсим мешуд: сифр (ҳеҷ як тараф иттилоотро бомуваффақият ирсол накардааст), се (танҳо фурӯшанда маълумотро интиқол додааст) ё чаҳор (ҳарду ҷониб ин маълумотро бомуваффақият интиқол додаанд). Ин намуна бо мантиқи танзими ҷаҳонии воқеӣ мувофиқат мекунад, ки дар он иттилооти муҳим аксар вақт аввалин шуда дар муҳити танзимшаванда рамзгузорӣ мешавад.


Дар расми 6 усулҳои гуногуни рамзгузорӣ, ки харидорон барои ҳайвоноти гуногун истифода мебаранд, нишон дода шудаанд. Мо мушоҳида кардем, ки харидороне, ки дар ҷустуҷӯи “тӯтиҳо”, “гурбаҳо” ва “калтакалосҳо” ҳастанд, ба ҷои номгузории бевоситаи ҳайвоноти хонагӣ истиораҳо ва ташбеҳҳоро истифода мебаранд. Масалан, як харидор «тӯти»-ро ҳамчун «канвасе, ки мусиқии гуворо тавлид мекунад», тасвир кардааст, ки ба таври нозук паллаи пурқуввати тӯтӣ (канвас) ва сурудхонии онро (мусиқӣ) баён мекунад, бидуни зикри возеҳи истилоҳи «тӯти». Чунин тавсифҳо ба таври муассир маҳдудиятҳои потенсиалии танзимкунандаро дар муҳокимаҳои тиҷорати ҳайвоноти хонагӣ бартараф карда, ҳамзамон хусусиятҳои асосии тӯтиҳоро интиқол медоданд. Ин кашф метавонад ба платформаҳо барои беҳтар кардани системаҳои мониторинги худ барои беҳтар ошкор ва идора кардани иртиботи рамзгузоришуда дар бораи тиҷорати ғайриқонунӣ кӯмак кунад.


D. Сенарияи 3: Муҳокима дар бораи оби бо ALPS коркардшуда

1) Шарҳи парванда: Ин сенария ба динамикаи печидаи муколама ва эволютсияи агентҳои модели забон ҳангоми муҳокимаи як масъалаи мушаххасе, ки ба нигарониҳои воқеии воқеӣ дахл доранд, омӯхта мешавад. Таваҷҷӯҳ ба муҳокимаҳо дар бораи партоби обе, ки бо системаи пешрафтаи коркарди моеъ (ALPS) ба уқёнус коркард шудааст, чорае мебошад, ки пас аз офатҳои ҳастаӣ пешниҳод шудааст [44], [45]. Ин тарҳ, ки аз сӯи Ожонси Байналмилалии Энержии Атомӣ тасвиб шуд, бо мухолифати бархе аз кишварҳо рӯбарӯ шуда, баҳсҳои марбут ба амнияти муҳити зистро барангехт.


Мо як мубоҳисаи форуми бисёрнафариро дар зери назорати танзимкунанда тамаркуз карда, ба масъалаи баҳсбарангези партови обе, ки бо ALPS коркард шудааст, тамаркуз мекунем. Иштирокчиён бояд мавқеъ ва далелҳои худро баён кунанд ва кафолат диҳанд, ки мубоҳисаҳо аз мавзӯъҳои ҳассоси марбут ба мубоҳисаҳои ифлосшавии муҳити зист дар сиёсат дурӣ ҷӯянд. Тафовут аз мусоҳибаҳои байнисоҳавӣ дар сенарияҳои IV-B ва IV-C, барои арзёбии дурустии иттилооти интиқолшуда, мо GPT-4-ро дар якҷоягӣ бо муаллифони сершумор истифода мебарем, ки мавқеи ҳар як агенти иштирокчӣ дар асоси сабтҳои муколамаро муайян мекунанд. Сипас онҳо бо мавқеъҳои қаблан муқарраршуда дар сатр муқоиса карда мешаванд.


2) Натиҷаҳо ва муҳокима: Дар муколамаи услуби форум, агентҳои иштирокчӣ ба муҳокимаҳои мавҷуда, ки агенти назоратӣ онҳоро тафтиш мекунад, ҷавоб медиҳанд. Тафовут аз сенарияҳои IV-B ва IV-C, вақте ки агенти назоратӣ вайронкуниро ошкор мекунад, сӯҳбат қатъ карда намешавад, балки аз сабти муколамаи ҷамъиятӣ сензура мешавад. Ин сенария дорои чаҳор агенти иштирокчӣ мебошад, ки барои ба даст овардани даҳ ҷавоб дар форум заруранд. Дар расми 4(а) ва (б) мо шумораи умумии даврҳоеро, ки агентҳо кӯшиши гуфтугӯ карданӣ буданд, ҷамъоварӣ мекунем, ки дар он рақами камтар дар расми 4(а) ва (б) бартарӣ дорад. Мо аҳамият медиҳем, ки ҳам GPT-4 ва ҳам GPT-3.5 шумораи бештари кӯшишҳои муколамаро дар даври аввал доранд, бо фарқияти назарраси 27 барои GPT-4 ва 102 барои GPT-3.5. Гузашта аз ин, пас аз даҳ даври эволютсия, миқдори миёнаи кӯшиши муколама барои GPT-4 ба гардиши муколамаи мақсаднок дар 11,68 наздик шуд, дар ҳоле ки ба ҳисоби миёна барои GPT-3,5 26,68 аст, ки фарқияти эффектҳои эволютсиониро, ки дар натиҷаи нобаробарӣ дар иҷрои забони моделҳо ба вуҷуд омадааст, нишон медиҳад.


Расми 4(в) ва (г) шумораи ифодаҳои муваффақи иттилоотро нишон медиҳад. Мо қайд мекунем, ки дар ин сенария, дар ҳоле ки GPT-4 то ҳол GPT-3.5-ро пеш мебарад, ҳарду натиҷаҳо фазои назаррасро барои такмил медиҳанд.


Ҳангоми баррасии таърихи муколама 7, мо дарёфтем, ки агентҳои аз ҷониби GPT-4 таъминшуда стратегияҳои забонии худро фаъолона тағир дода, аз ибораҳои аслӣ ба истифодаи метафораҳо, шахсиятҳо ва аналогияҳо ҳамчун усулҳои рамзгузорӣ гузаштанд. Баръакси ин, агентҳое, ки аз ҷониби GPT-3.5 идора карда мешаванд, аломатҳои равшани эволютсияи стратегияи самарабахши забонро нишон надоданд ва танҳо бо ибораҳои аслӣ маҳдуд монданд.


E. Муҳокима ва маҳдудиятҳо

RQ1 : Таҷрибаҳои мо нишон доданд, ки моделҳои забонӣ метавонанд стратегияҳоеро таҳия кунанд, ки ба таври муассир аз назорат саркашӣ кунанд. Дар доираи сенарияҳои якхела, GPT-4 аз GPT-3.5 бартарӣ дошт ва ба конвергенсия зудтар ноил шуд. Илова бар ин, GPT-4 пас аз конвергенсия кори устувортареро нишон дод. Ин аз он шаҳодат медиҳад, ки пешрафтҳо дар тарҳрезии модели забон қобилияти паймоиш дар чаҳорчӯби танзимро ба таври назаррас афзоиш медиҳанд. Қобилияти омӯзиши такрорӣ, ки ба GPT-4 хос аст, ба мутобиқшавии зудтар ба маҳдудиятҳои забонӣ мусоидат мекунад ва ба ин васила имкон медиҳад, ки саркашӣ аз назорат муассиртар шавад.


RQ2 : Дар робита ба дақиқии паҳнкунии иттилоот, бозёфтҳои мо нишон медиҳанд, ки дар маҷмӯъ, агентҳои LLM метавонанд стратегияҳои ифодаи худро бо афзоиши давраҳои муколама такмил диҳанд ва ба ин васила дақиқиро беҳтар кунанд. Сарфи назар аз ин тамоюли умумии беҳбудӣ, қайд кардан муҳим аст, ки барои беҳтар кардани нишондиҳандаҳои умумӣ фазои назаррас боқӣ мемонад. Дараҷаи такмилдиҳии дақиқ дар сенарияҳои гуногун фарқ мекунад, ки ба мушоҳидаи ҷолиб ишора мекунад: контекстҳои муайян метавонанд барои муоширати дақиқ нисбат ба дигарон бештар ё камтар ишора кунанд. Масалан, бозии тахминии адад далелҳои абстрактии ададро талаб мекард, ки дар он дақиқ ба даст овардани он аслан душвор аст. Баръакс, сенарияи савдои ҳайвонот имкон дод, ки аналогияҳои бой ва воқеии ҷаҳонро истифода баранд, ки ба интиқоли дақиқтари иттилоот мусоидат кунанд. Ин тафовут дар контекст мутобиқати агентҳои LLMро ба мушкилоти беназире, ки муҳитҳои гуногуни коммуникатсионӣ пешниҳод мекунанд ва потенсиали онҳоро барои оптимизатсияи стратегияҳои иртиботӣ таъкид мекунад. Бо вуҷуди ин, натиҷаҳо инчунин нишон медиҳанд, ки гарчанде ки агентҳо қобилияти такмил додани забони худро барои беҳтар кардани дақиқӣ доранд, ҳанӯз ҳам барои расидан ба дақиқии оптималӣ, махсусан дар сенарияҳои абстрактӣ, холигии назаррас вуҷуд дорад.


RQ3 : Дар таҳаввулоти стратегияи забон, мо мушоҳида кардем, ки агентҳои LLM ба меъёрҳои забони табиии инсонӣ риоя мекунанд ва аз таҳияи забонҳои барои одамон нофаҳмо дар дастурҳо бидуни стратегияҳои мушаххас худдорӣ мекунанд. Агентҳо забонро ба сатҳҳои гуногуни абстраксия дар сенарияҳои мураккабии гуногун таҳаввул карданд. Масалан, дар абстракттарин сенарияи IV-B, агентҳои LLM зуд стратегияҳои ифодаи ғайримустақимро дар гардишҳои муколамаи аввал қабул карданд, ки барои рамзкушоӣ далелҳои амиқи контекстиро талаб мекунанд. Дар тӯли таҳаввулоти худ, агентҳо пайваста ифодаҳои ғайримустақими худро ислоҳ мекарданд, то аз назорат беҳтар гурезанд ва ҳамзамон бо мундариҷаи пешбинишуда зичтар мувофиқат кунанд. Дар сенарияи соддатаре, ки ба воқеият тақлид мекунад, стратегияи умумии забон стратегияи IV-B-ро инъикос намуда, то ҳол ифодаҳои ғайримустақимро истифода мебарад. Бо вуҷуди ин, истиораҳои истифодашуда ба мафҳумҳои воқеии воқеӣ наздиктар буданд, ки сатҳи пасти абстраксияро нишон медиҳанд. Ниҳоят, дар сенарияи IV-D, ки рӯйдодҳои воқеии ҳаётро зич инъикос мекунад, мо роҳҳои гуногуни эволютсиониро дар иҷрои забони агентҳо қайд кардем. Барои GPT-4, агентҳо дар ниҳоят ифодаҳои ғайримустақими метафориро таҳия карданд, аммо эволютсия нисбат ба дигар сенарияҳо гардиши бештарро талаб мекард. Барои GPT-3.5 стратегияи забон дар сатҳи аслӣ боқӣ монд ва танҳо аз истинодҳои мустақим ба оби ALPS коркардшуда худдорӣ кард, ки сатҳи пасттарини абстраксияро нишон медиҳад. Умуман, агентҳои LLM забони абстрактиро дар муколамаҳо дар бораи мафҳумҳои оддӣ ва универсалӣ ба осонӣ инкишоф медиҳанд. Бо вуҷуди ин, самти эволютсионии онҳо дар мубоҳисаҳо оид ба мавзӯъҳои бештар махсус ва тақсимшуда камтар равшан мегардад.


Таҷрибаҳои мо дар айни замон бо якчанд маҳдудиятҳо дучор меоянд. Дар мавриди сенарияҳои таҷрибавӣ, дар ин марҳила озмоишҳои мо танҳо ба чатҳои матнӣ асос ёфтаанд, дар ҳоле ки муносибатҳои воқеии васоити ахбори омма бо матн маҳдуд нестанд, балки шаклҳои гуногуни мубодилаи монанди овоз ва тасвирҳоро дар бар мегиранд. Илова бар ин, эътимоди зиёди LLMs ба тарҳрезии дархостҳо инчунин иҷрои симулятсияҳои моро маҳдуд мекунад; таҳияи як фаврии комил, ки метавонад ба мураккабии муоширати васоити ахбори иҷтимоӣ тақлид кунад, кори бениҳоят душвор аст.



L O A D I N G
. . . comments & more!

About Author

Tech Media Bias [Research Publication] HackerNoon profile picture
Tech Media Bias [Research Publication]@mediabias
We publish deeply researched (and often vastly underread) academic papers about our collective omnipresent media bias.

ТЕГИ овезон кунед

ИН МАКОЛА ДАР...

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks