Հեղինակային փաթեթներ
2.2.2 Կատեգորիաների բաղադրիչները G- ն ստեղծելու համար
3 Հյուրատետր եւ 3.1 Հյուրատետր փորձառույթներ
4.2 Սպիտակային արտադրություն: Proscript
3.3 Արդյունաբերության վերահսկողություն: PROPARA
3.4 Սպիտակների գրաֆիկների արտադրություն: EXPLAGRAPHS
6 Հասկածություն, հավատումներ, սահմանափակումներ եւ տեղեկություններ
A Few-Shot մոդելների չափը ծախսերը
G- ը Python- ի դասընթացների նախագծման համար կառուցված գործառույթների համար
H-ը մոդելային չափի ազդեցությունը
2 COCOGEN- ը: Կոմսենսային կառուցվածքներ մատակարարում Code- ի հետ
Մենք կենտրոնանում ենք կառուցված բաղադրիչների բաղադրիչների գործառույթների վրա: Այս գործառույթների յուրաքանչյուր ուսուցման օրինակ է ձեւով (T, G), որտեղ T- ը տեքստային տպագրություն է, եւ G- ը բաղադրիչը է, որը արտադրվում է (պատկապես գրաֆորմ). COCOGEN- ի հիմնական գաղափարը է փոխել արտադրանքի գրաֆորմը G- ն մի սենմենալական միասնական ծրագրային Gc- ին, որը գրված է ընդհանուր նպատակային ծրագրային լեզուում: Այս աշխատանքում մենք ընտրել ենք Python- ը, քանի որ այն հայտնի է ժամանակակից CodeLLM- ի (Xu et al., 2022) ուսուցման տվյալների մեջ, բայց մեր դիզայնը պլանտիկ է ծրագրային լեզուին: Գրա
Մենք օգտագործում ենք սեղմիչների արտադրման աշխատանքը (PROSCRIPT, սեղմիչ 1): Սեղմիչների արտադրման նպատակն է ստեղծել սեղմիչը (G), որպեսզի հասկանալ որոշակի բարձր մակարդակի նպատակը (T).
2.1 Կոնդալում (T, G) է Python կոդը
Մենք փոխադրում ենք (T, G) կոճակը Python դասի կամ գործառույթի համար: Հիմնական գործընթացը ներառում է տպագրության տպագրության T-ը տպագրության սկսած, որպես դասի տպագրական տպագրություն կամ նկարագրական տպագրություն, եւ սեղմում է կառուցվածքը G օգտագործելով ստանդարտ կոճակներ, որոնք ներառում են կառուցվածքը կոճի մեջ (հարկե, hashmaps, գործառույթների տպագրություններ) կամ գործառույթների կոճակներ: Հիմնական նպատակը այստեղ է տպագրել Python կոդը, որը ներառում է (T, G) կոճակը, բայց պահպանվում է տպագրության եւ կոճի տպագրական Python կոդը:
Տեսակ 1b- ը ավելացվում է որպես դասընթացային հատկանիշը (մարթ), եւ սարթը G- ը ավելացվում է սեղմելով սեղմիչները եւ գարթները միասին: Մենք առաջին անգամ սեղմիչների ցուցակը տեղադրում ենք որպես դասընթացային Node- ի գործիքներ: Այնուհետեւ սեղմիչները ավելացվում են որպես սեղմիչների երեխաներ յուրաքանչյուր սեղմիչի համար (մարթ 1b). Օրինակ, մենք տեղադրում ենք սեղմիչը «Հեռնել մի քանի սեղմիչներ» որպես take_out_several_plates = Node(), եւ ավելացնել այն որպես սեղմիչը take_pies_out_to_cool.
Երբ ունենք բազմաթիվ մեթոդներ, որոնք ցույց են տալիս, որ ուսուցման օրինակը Python դասընթացն է, մենք ստացել ենք, որ այս հարմարաբար պարզ ձեւավորումը առավել արդյունավետ է, հատկապես ավելի մեծ մոդելների հետ: Մենք վերլուծում ենք ձեւավորման ընտրությունը եւ իր կապը մոդելի չափի հետ 4.
2.2.2 Կատեգորիաների բաղադրիչները G- ն ստեղծելու համար
Մեր փորձում, մենք օգտագործել CODEX (Chen et al., 2021a) եւ գտնել է, որ այն մոտավորապես միշտ արտադրում է syntactically ճշգրիտ Python. Այսպիսով, արտադրված կոդը կարող է հեշտությամբ փոխվել վերցնել մի գրաֆորմով եւ գնահատել օգտագործելով տվյալների միավորի ստանդարտ, Original, մետրիկներ. Ապրիշ F ցուցադրում է նմուշ խոստերի համար յուրաքանչյուր գործառույթների մենք փորձել ենք.
Այս գրասենյակը հասանելի է CC BY 4.0 DEED License- ի կողմից.
ՀիմնականԱյս թերթըԱրդյոք հասանելի էCC BY 4.0 DEED լուսավորումը.
Նրա գրասենյակներ :
Հիմնական(1) Aman Madaan, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
Հիմնական(2) Shuyan Zhou, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
Հիմնական(3) Uri Alon, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
Հիմնական(4) Yiming Yang, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
Հիմնական(5) Graham Neubig, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
ՀիմնականAuthors:
(1) Aman Madaan, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
(2) Shuyan Zhou, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
(3) Uri Alon, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
(4) Yiming Yang, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])
(5) Graham Neubig, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])