131 ընթերցումներ Նոր պատմություն

Երբ սեղմվում են AI Chatbots, Context- ը մի Double-Edged Sword- ը

կողմից Model Tuning5m2025/04/07
Read on Terminal Reader

Չափազանց երկար; Կարդալ

Շատ կամ շատ քիչ երկխոսության համատեքստը շեղում է, թե ինչպես են մեկնաբանողները գնահատում AI համակարգերը: LLM-ների ամփոփ համատեքստը բարելավում է պիտակի հետևողականությունը՝ ավելի քիչ ջանք գործադրելով:
featured image - Երբ սեղմվում են AI Chatbots, Context- ը մի Double-Edged Sword- ը
Model Tuning HackerNoon profile picture
0-item

Ապրանքներ:

(1) Clemencia Siro, University of Amsterdam, Amsterdam, Netherlands;

(2) Mohammad Aliannejadi, University of Amsterdam, Amsterdam, Netherlands;

(3) Maarten de Rijke, University of Amsterdam, Amsterdam, Netherlands.

Արդյունաբերողները:

Այս գրողները:

(1) Clemencia Siro, University of Amsterdam, Амстердам, Չինաստան;

(2) Mohammad Aliannejadi, University of Amsterdam, Амстердам, Չինաստան;

(3) Maarten de Rijke, University of Amsterdam, Amsterdam, Չինաստան.

Table of Links

Հեղինակը

Տեսանյութ եւ 1 Հիմնական

Տեսանյութ եւ 1 Հիմնական

2 Մետաղադրություն եւ 2.1 Ապրանքի տվյալները եւ աշխատանքները

2 Մետաղադրություն եւ 2.1 Ապրանքի տվյալները եւ աշխատանքները

2.2 Ավտոմատ արտադրություն տարբեր դեղեկտրոնային բաղադրիչների

2.2 Ավտոմատ արտադրություն տարբեր դեղեկտրոնային բաղադրիչների

2.3 Crowdsource փորձեր

2.3 Crowdsource փորձեր

2.4 Հիմնական պայմաններ

2.4 Հիմնական պայմաններ

2.1 Մարդիկ

2.1 Մարդիկ

3 արդյունքները եւ վերլուծությունը եւ 3.1 տվյալների ստանդարտություն

3 արդյունքները եւ վերլուծությունը եւ 3.1 տվյալների ստանդարտություն

3.2 RQ1: Ապրանքը տարբեր քանակի առեւտրային միջավայրի

3.2 RQ1: Ապրանքը տարբեր քանակի առեւտրային միջավայրի

3.3 RQ2: Ապրանքը ավտոմատ generated dialogues միջավայրի

3.3 RQ2: Ապրանքը ավտոմատորեն ստեղծվող խոսակցային բաղադրիչների վրա

4 Ապրանքներ

4 Ապրանքներ եւ ազդեցություններ

5 Related Work

5 Անձնական աշխատանք

6 Սպիտակներ, սահմանափակումներ, եւ Դիտակներ

6 Կառուցումներ, սահմանափակումներ, եւ Հեղինակային հարցեր

7 Հիմնական տեղեկություններ

7 Հիմնական տեղեկություններ

Ա. Ապրիշ

Ա. Ապրիշ

Ապիտակագրություն

Ապահասենյակային մանրամասները խաղում են կարեւոր role in evaluating task-oriented dialogue systems (TDSs)): Ապահասենյակներիից բարձր որակի եւ համատեղելի բաղկացած ճշմարտության մանրամասների ստանալը առաջարկում է խնդիրներ: Երբ գնահատում են TDS- ը, մանրամասները պետք է ճշմարտությունը բացահայտել, նախընտրական ուսումնասիրությունները առաջարկում են օգտագործել միայն մի մասը զանգվածային մանրամասների մանրամասների մանրամասների մանրամասներում: Սակայն, այս մանրամասների որակի ծախսերի ազդեցությունը չգիտվում է: Այս ուսումնասիրությունը ուսումնասիրում է զանգվածային մանրամասների մանրամասների ազդեցությունը զանգվածային մանրամաս

1 Հիմնական էջ

Անհարկե, առաջադեմ լեզուների մոդելների եւ մեծ լեզուների մոդելների (LLMs) վերջին առաջադեմների հետ, գործառույթային փոխանակման համակարգեր (Task-Oriented Dialogue Systems, TDSs) վերլուծել են, թե ինչպիսիք են մարդկանց տեղեկատվություն ստանալը, ինչպիսիք են օգտագործողների հետ տեղեկատվության աղբյուրների համատեղելու ավելի բնական ձեւը (Budzianowski and Vulic ́, 2019; Wu et al., 2020)։ Երբ TDS- ները ավելի շատ ներառում են տեղեկատվության ստանալների գործընթացներին, հարցը, թե ինչպես ճշգրիտ եւ արդյունավետ է փոխանակել իրենց կատարումը, կարեւոր է: Հիմնական մետրիկների հզոր համատեղելիությունը մարդային ստեղծվող մետիկների հետ (Deriu et al.,


Մատեգորիաների տարբեր տեխնոլոգիաների օգտագործման համար օգտագործվել են հիմնական ճշմարտության մետաղադրամները, ինչպիսիք են սխալային մետաղադրամները (Sun et al., 2021), որտեղ մետաղադրամները փնտրում են յուրաքանչյուր մետաղադրամը եւ մետաղադրամները մետաղադրամները մեկից մեկով: Այս մետաղադրամը մետաղադրամների գործընթացում ներառում է որոշ վտանգները, ինչպիսիք են մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամների մետաղադրամ


Այս հարցին լուծելու համար, մի այլ հետազոտական գծի առաջարկում է անմիջապես նմուշել միայն մի քանի խոսքեր է յուրաքանչյուր խոսքերում (Mehri and Eskenazi, 2020; Siro et al., 2022, 2023): Երբ լուծում է բարձր գիտական բջջային եւ խուսափության, սահմանափակելով ալանտատորների հասկանալը խոսքերից, նշանակում է բացառիկ վտանգներ, ինչպիսիք են անպայման եւ խուսափված ալանտատորներ (Schmitt and Ultes, 2015; Siro et al., 2022). Հիմնականապես, մի շարք խոսքերի բջջային բջջային կարող է առաջացնել ալանտատորներ: Օրինակ, ալանտատորները, ովքեր չկան բջջային բջջ


Ապրիշ աշխատանքի հետազոտել է գործառույթներ, որոնք ազդում են որակի եւ միասնականությունը crowdsourced evaluation label- ի, այդ թվում annotator հատկանիշները, arXiv:2404.09980v1 [cs.CL] 15 Apr 2024- ի գործառույթների դիզայնը, գիտելիքի բեռը, եւ evaluation protocols- ի (լուսանկարներ, օրինակ, Parmar et al., 2023; Roitero et al., 2021, 2020; Santhanam et al., 2020)


Այս ուսումնասիրում, մենք ցանկանում ենք վերահսկել այս հետազոտական խոշորությունը, հետազոտելով, թե ինչպիսիք են տարբեր մանրամասն տեղեկատվության չափերը, որոնք ազդում են TDS- ի հետազոտական մանրամասների որակի եւ համոզվածության վրա, ինչպիսիք են այդ դիզայնի ընտրությունների ազդեցությունը: Մենք փորձում ենք հետազոտական մանրամասների հետ, ինչպիսիք են երկու հիմնական evaluation- ի մասերի համար, ինչպիսիք են, relevantity- ի եւ utility- ի տարբեր պայմաններում, որտեղ մենք համեմատում ենք մանրամասների որակի տարբեր մանրամասային մանրամասների մանրամասների պլաստիկների մեջ:


Մենք առաջարկում ենք օգտագործել heuristic մեթոդներ եւ LLM- ները օգտագործելու համար օգտագործողի տեղեկատվության պահանջների եւ փոխանակման փոխանակման ստեղծելու համար: LLM- ները կարող են խաղալ դիզայնի օգնության role- ը (Faggioli et al., 2023)- ի հետ, որ փոխանակման պատմությունը փոխանակում են, ինչպես նաեւ ավելի արդյունավետ եւ արդյունավետ համոզվածությունը փոխանակման փոխանակման փոխանակման փոխանակման առաջ: Այս նպատակին, մենք օգտագործում ենք GPT-4- ը փոխանակման փոխանակման փոխանակման համար եւ փոխանակման կատարումը տարբեր պայմաններում, ինչպես նաեւ տարբեր փոխանակման չափով: Այս փորձերի միջոցով, մենք պատասխանում ենք երկու հիմնական հարցերին: (RQ1) Ինչպե՞ս փոխանակման փոխանակման փոխանակման փոխանակման փոխանակման ազդում է TDS


Այս արդյունքները ցույց են տալիս, որ առաջադեմ խոսակցային բաղադրիչների հասանելիությունը կարեւորորեն ազդեցում է խոսակցային բաղադրիչների ռեժիմները, որը հասանելիորեն ազդում է իրենց որակի վրա: Չնայած առաջադեմ բաղադրիչների բաղադրիչները կարող են ստանալ ավելի լավ ռեժիմներ համակարգի պատասխանների համար, որը կարող է լինել անսահմանափակ բաղադրիչների բաղադրիչների համար, ինչպիսիք են բաղադրիչների բաղադրիչների բաղադրիչների բաղադրիչները: Հիմնականորեն, ամբողջ խոսակցային բաղադրիչների բաղադրիչների բաղադրիչների բաղադրիչները ավելի բարձր են: Որպես որ օգտակարությունը, ամբողջ խոսակցային բաղադրիչների բաղադրիչների բ


Մենք հասկանում ենք, որ մեր արդյունքները ներառում են այլ գործառույթային փոխանակման գործառույթներ, ինչպիսիք են զանգվածային որոնման եւ հարմարավետության ստեղծման, այնպես էլ, որ համակարգի արդյունավետության գնահատման համար օգտագործվում են crowdsourced փորձերը:


«Այս գրասենյակը լուծվում է arxiv- ում CC BY 4.0 DEED- ում:


Այս թերթը լուծվում է arxiv- ում CC BY 4.0 DEED- ում:

լուծվում է arxiv«Այս»

[1] Այս տարածքում հետազոտությունների օգնության համար, մենք բացահայտում ենք մեր տվյալները բացահայտելու համար https://github.com/Clemenciah/ Effects-of-Dialogue-Context

Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks