Նոր պատմություն

Ինչպե՞ս փոխել Python Code- ը

կողմից The FewShot Prompting Publication 3m2025/04/22
Read on Terminal Reader

Չափազանց երկար; Կարդալ

COCOGEN- ը համոզված գծերի գործիքները փոխում է Python- ի կոդը, որը թույլ է տալիս CodeLLM-ներին, ինչպիսիք են CODEX- ը, ստուգել ճշգրտական ռեժիմային կառուցվածքներ, օգտագործելով հայտնի սինթայսը:
featured image - Ինչպե՞ս փոխել Python Code- ը
The FewShot Prompting Publication  HackerNoon profile picture
0-item

Հեղինակային փաթեթներ

Abstract եւ 1 ներսում

2 COCOGEN- ը: Commonsense- ի կառուցվածքները մատակարարում է կոդը եւ 2.1 Converting (T,G) to Python code

2.2.2 Կատեգորիաների բաղադրիչները G- ն ստեղծելու համար

3 Հյուրատետր եւ 3.1 Հյուրատետր փորձառույթներ

4.2 Սպիտակային արտադրություն: Proscript

3.3 Արդյունաբերության վերահսկողություն: PROPARA

3.4 Սպիտակների գրաֆիկների արտադրություն: EXPLAGRAPHS

4 Ապրանքներ

5 Հիմնական աշխատանքներ

6 Հասկածություն, հավատումներ, սահմանափակումներ եւ տեղեկություններ

A Few-Shot մոդելների չափը ծախսերը

B Dynamic prompt ստեղծում

C Մարդական արժեքը

D-ի տվյալների մանրամասներ

Ապրանքներ եւ մոդելներ

F Բարձրություն

G- ը Python- ի դասընթացների նախագծման համար կառուցված գործառույթների համար

H-ը մոդելային չափի ազդեցությունը

Տղամարդկանց տարբերություն

2 COCOGEN- ը: Կոմսենսային կառուցվածքներ մատակարարում Code- ի հետ

Մենք կենտրոնանում ենք կառուցված բաղադրիչների բաղադրիչների գործառույթների վրա: Այս գործառույթների յուրաքանչյուր ուսուցման օրինակ է ձեւով (T, G), որտեղ T- ը տեքստային տպագրություն է, եւ G- ը բաղադրիչը է, որը արտադրվում է (պատկապես գրաֆորմ). COCOGEN- ի հիմնական գաղափարը է փոխել արտադրանքի գրաֆորմը G- ն մի սենմենալական միասնական ծրագրային Gc- ին, որը գրված է ընդհանուր նպատակային ծրագրային լեզուում: Այս աշխատանքում մենք ընտրել ենք Python- ը, քանի որ այն հայտնի է ժամանակակից CodeLLM- ի (Xu et al., 2022) ուսուցման տվյալների մեջ, բայց մեր դիզայնը պլանտիկ է ծրագրային լեզուին: Գրա


Մենք օգտագործում ենք սեղմիչների արտադրման աշխատանքը (PROSCRIPT, սեղմիչ 1): Սեղմիչների արտադրման նպատակն է ստեղծել սեղմիչը (G), որպեսզի հասկանալ որոշակի բարձր մակարդակի նպատակը (T).

2.1 Կոնդալում (T, G) է Python կոդը

Մենք փոխադրում ենք (T, G) կոճակը Python դասի կամ գործառույթի համար: Հիմնական գործընթացը ներառում է տպագրության տպագրության T-ը տպագրության սկսած, որպես դասի տպագրական տպագրություն կամ նկարագրական տպագրություն, եւ սեղմում է կառուցվածքը G օգտագործելով ստանդարտ կոճակներ, որոնք ներառում են կառուցվածքը կոճի մեջ (հարկե, hashmaps, գործառույթների տպագրություններ) կամ գործառույթների կոճակներ: Հիմնական նպատակը այստեղ է տպագրել Python կոդը, որը ներառում է (T, G) կոճակը, բայց պահպանվում է տպագրության եւ կոճի տպագրական Python կոդը:


Տեսակ 1b- ը ավելացվում է որպես դասընթացային հատկանիշը (մարթ), եւ սարթը G- ը ավելացվում է սեղմելով սեղմիչները եւ գարթները միասին: Մենք առաջին անգամ սեղմիչների ցուցակը տեղադրում ենք որպես դասընթացային Node- ի գործիքներ: Այնուհետեւ սեղմիչները ավելացվում են որպես սեղմիչների երեխաներ յուրաքանչյուր սեղմիչի համար (մարթ 1b). Օրինակ, մենք տեղադրում ենք սեղմիչը «Հեռնել մի քանի սեղմիչներ» որպես take_out_several_plates = Node(), եւ ավելացնել այն որպես սեղմիչը take_pies_out_to_cool.


Երբ ունենք բազմաթիվ մեթոդներ, որոնք ցույց են տալիս, որ ուսուցման օրինակը Python դասընթացն է, մենք ստացել ենք, որ այս հարմարաբար պարզ ձեւավորումը առավել արդյունավետ է, հատկապես ավելի մեծ մոդելների հետ: Մենք վերլուծում ենք ձեւավորման ընտրությունը եւ իր կապը մոդելի չափի հետ 4.

2.2.2 Կատեգորիաների բաղադրիչները G- ն ստեղծելու համար





Figure 2: COCOGEN uses a prompt consisting of k (5-10) Python classes. During inference, the test input is converted to a partial class, as shown above, appended to the prompt, and completed by a code generation model such as CODEX.



Մեր փորձում, մենք օգտագործել CODEX (Chen et al., 2021a) եւ գտնել է, որ այն մոտավորապես միշտ արտադրում է syntactically ճշգրիտ Python. Այսպիսով, արտադրված կոդը կարող է հեշտությամբ փոխվել վերցնել մի գրաֆորմով եւ գնահատել օգտագործելով տվյալների միավորի ստանդարտ, Original, մետրիկներ. Ապրիշ F ցուցադրում է նմուշ խոստերի համար յուրաքանչյուր գործառույթների մենք փորձել ենք.


Հիմնական

Այս գրասենյակը հասանելի է CC BY 4.0 DEED License- ի կողմից.

Հիմնական

Այս թերթըԱրդյոք հասանելի էCC BY 4.0 DEED լուսավորումը.


Հիմնական

Նրա գրասենյակներ :

Հիմնական

(1) Aman Madaan, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

Հիմնական

(2) Shuyan Zhou, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

Հիմնական

(3) Uri Alon, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

Հիմնական

(4) Yiming Yang, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

Հիմնական

(5) Graham Neubig, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

Հիմնական

Authors:

(1) Aman Madaan, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

(2) Shuyan Zhou, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

(3) Uri Alon, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

(4) Yiming Yang, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])

(5) Graham Neubig, Language Technologies Institute, Carnegie Mellon University, ԱՄՆ ([email protected])


Trending Topics

blockchaincryptocurrencyhackernoon-top-storyprogrammingsoftware-developmenttechnologystartuphackernoon-booksBitcoinbooks