paint-brush
Triks, ko mūs pamudināja aģentu sistēmasautors@tyingshoelaces
286 lasījumi

Triks, ko mūs pamudināja aģentu sistēmas

autors tyingshoelaces.com8m2024/11/15
Read on Terminal Reader

Pārāk ilgi; Lasīt

Aģentiskās mākslīgā intelekta sistēmas ir neuzticamas un būtībā nereālas abstrakcijas. Lai izveidotu sarežģītas, ķēdes un atkārtojamas plūsmas, izmantojot LLM, ir vajadzīgas zināšanas, prasmes un smags darbs.
featured image - Triks, ko mūs pamudināja aģentu sistēmas
tyingshoelaces.com HackerNoon profile picture
0-item


Lielākais triks, ko velns jebkad ir izmēģinājis, bija pārliecināt pasauli, ka viņš neeksistē…

Jūs esat dzirdējuši slaveno citātu: "Vislielākā viltība, ko velns jebkad ir izvilcis, bija pārliecināt pasauli, ka viņš neeksistē."


Teoloģiskās atsauces šeit ir svarīgas, jo vairāk nekā jebkurš tehnoloģiskais sasniegums pēdējā laikā, mānija, kas saistīta ar ģeneratīvo AI, ir vairāk reliģija, nevis zinātne vai inženierija.


Šī emuāra mērķis nav cīnīties ar ažiotāžu (iesaku Geriju Markusu ) par pretsvaru. Šī ir kritiska analīze par čūsku eļļu, kas tiek pārdota nenojaušam patērētājam. Man ir vienkārša tēze. Aģentiskās mākslīgā intelekta sistēmas ir neuzticamas un būtībā nereālas abstrakcijas. Lai izveidotu sarežģītas, ķēdes un atkārtojamas plūsmas, izmantojot LLM, ir vajadzīgas zināšanas, prasmes un smags darbs.


Ir vilinoši meklēt īsceļu, sudraba lodi; bet jūs varat vai nu braukt ar hype vilcienu, līdz sliedes nokrīt, vai būvēt pamatus tālajam braucienam.

Kas ir aģents AI?

Atšķirība starp kviešiem un pelavām


“Aģentiskais AI ir revolucionārs sasniegums mākslīgā intelekta jomā. Dažādu mākslīgā intelekta metožu, modeļu un pieeju kombinācija nodrošina jaunu autonomo aģentu šķirni, kas var analizēt datus, noteikt mērķus un rīkoties, lai tos sasniegtu — viss ar minimālu cilvēka uzraudzību. Aģentiskais mākslīgais intelekts ļauj šiem autonomajiem aģentiem sasniegt gandrīz cilvēka izziņu daudzās jomās, pārvēršot tos par problēmu risināšanas mašīnām, kas plaukst dinamiskā vidē un pastāvīgi mācās un uzlabojas ar katru mijiedarbību.


Oho. Apbrīnojami. Prātas pārsteidzošs.


Arī pilnīgas muļķības... Ļaujiet man mēģināt,


Aģentiskais AI ir ģeneratīvā AI izmantošana sarežģītās darbplūsmās. LLM radītie rezultāti var būt vai nebūt saistīti ar piešķirto uzdevumu. Aģentiskais mākslīgais intelekts pārmanto izsmalcinātību, inteliģenci un izvades uzticamību no sistēmas instrukcijām un programmēšanas, no kurām lielākā daļa ir ļoti abstrakta, ko rakstījuši iesācēji, un rezultātā sistēma gandrīz nedarbojas.


Aģentiskais mākslīgais intelekts ir lieliski piemērots demonstrāciju izveidei nesarežģītiem patērētājiem, taču parasti tas nav piemērots ieviešanai jebkurā lietošanas gadījumā, ja rezultāts patiešām ir svarīgs. Tas nedarbosies vispār, ja vien neesat eksperts, bet gandrīz noteikti ne.


Teikšu skaidri, es ne mazākā mērā neesmu skeptisks par Gen AI, manuprāt, tas tiek izmantots prasmīgi, un, izmantojot rīkus, kas vēl neeksistē, mēs varam ieviest darbplūsmas, kas mainīs veidu, kā mēs veicam uzdevumus. Varbūt ne tādā mērā, par ko runā AI likteņa sludinātāji, bet noteikti līdz paradigmas maiņai daudzos darba veidos.


Tā nav nejaušība, ka pirmais Gen AI izmantošanas gadījums ir programmēšana, jo programmēšana vienmēr būs pirmais domēns, kurā tiks iegūti atbilstoši instrumenti un infrastruktūra. Iemesls tam ir vienkāršs. Mēs veidojam instrumentus un infrastruktūru programmēšanas rīkiem ar, errrm, programmēšanu. Programmēšana ir zema līmeņa problēma, ideāls pirmās lietošanas gadījums. Tā ir arī prasme, kas, starp citu, joprojām būs (ja ne "tā") atbilstošā un iekārojamākā spēja dienām, nedēļām, mēnešiem, gadiem un, iespējams, nākamajām paaudzēm.


Kodēšanas rīki ir pierādījuši Gen AI potenciālu. Man ir divi atsevišķi LLM rīki, kurus es (maksāju un) izmantoju katru dienu kodēšanai, jo tos bieži bloķē milzīgais pieprasījums un zaļā infrastruktūra. Es tos izmantoju vienlaikus dažādos IDE logos. Tas ir tāpēc, ka tie ir jauni, tāpēc lēni un dažreiz pārslaini.


Pat šādi viņi ir mainījuši manu darbplūsmu. Man ir slikta diena, kad es sāku datoru un Klods ir aizņemts, tāpēc es tā vietā runāju ar o1-mini. Un tas ir sākums mainīgajiem veidiem, kā Gen AI mainīs jūsu darba veidu…


Šie instrumenti tiek veidoti no paša sākuma; tie ir pilnīgi jauni un vēl nav uzticami. Tas ir aizraujoši, jo tas ir sākums. Esam jauna viļņa vidū. Kas mani noved pie šī emuāra tēmas. Meli un pārspīlētība, kas ir aģents AI.

Aģentiskā AI meli

Vienkārša sarežģītas neuzticamas API abstrakcija.


Pirms daudziem gadiem es vadīju attīstības aģentūru, un mums komandai pievienojās tikko absolvējis izstrādātājs. Es uzstādīju viņiem diezgan vienkāršu uzdevumu (izveidot tīmekļa veidlapu PHP). Es regulāri reģistrētos.


“Kā iet?


“Tiešām labi!


Pagāja dienas un nedēļas, un tastatūrai pieskarties pieskaroties. Tas aizņēma pārāk ilgu laiku, tāpēc es devos pie programmētāja un palūdzu parādīt man kodu, pie kura viņi bija strādājuši. Tas bija ligzdots forEach cilpu slānis, kas sasniedza tūkstošiem koda rindu.


Man iegrima vēders (klients to gaidīja...), un man trūka vārdu. Tas bija fizisks trieciens, viss noklikšķināja. Vai tā bija mana vaina, ka nesniedzu norādījumus? Vai programmētājs bija zaudēts iemesls? Kāda velna pēc es teikšu klientam, kuram par to ir jāmaksā? (Mēs maksājām laiku, nevis rezultātus...)


Iemesls, kāpēc es novirzos, ir tāpēc, ka šī ir tieši tāda pati sajūta, kāda man rodas, lasot dokumentus par jebkuru aģentu sistēmu, ar kuru esmu saskāries. Es neesmu viens.



Es nevēlos izvēlēties kādu konkrētu ietvaru (pagaidām neesmu atradis nevienu Python Agentic Framework, kuram nevaru to piemērot), taču, kad jūsu dokumenti sāk runāt par lomām un darbiniekiem, priekšniekiem un aizmugures stāstiem, sākas visa koncepcija. lasīt kā fantāzijas romānu.


Iemesls ir tāds, ka visa lieta IR fantāzijas romāns. Tas ir revolucionārs un izsmalcināts rīks, kas izveidots, izmantojot novatorisku tehnoloģiju, kas darbojas jau sākotnēji, iesācējiem. Un viss tik sarežģīti un pretrunīgi, kā tas izklausās.


Es nesaku, ka sarežģītas LLM darbplūsmas nevar darboties; Es saku, ka nepieciešamās zināšanas un nianšu kontroles līmenis ir ārkārtīgi augsts, un "vienkāršu un pieejamu" ietvaru izveide ir vienkārši neiespējama, kamēr instrumenti nav nobrieduši un pamati nav stingrāki.


Šobrīd pasaulē ir ļoti maz cilvēku (lai gan viņi staigā starp mums!), kuriem ir zināšanas, lai izveidotu un uzturētu uzticamas, sarežģītas iteratīvas darbplūsmas (pamatojoties uz Gen AI vai ne!), kas darbojas un atbilst Agentic definīcijai. darbplūsmas, kuru lielākā daļa tiek pārdota.


Bet šeit ir lieta, kas mani bugs; šie daži pionieri strādā pie vismodernākajiem lietošanas gadījumiem, par kuriem mēs, iespējams, nezinām. Viņi neveidojas publiski pakalpojumā Twitter, kā arī neraksta emuārus un ceļvežus. Tie nav vērsti uz ietvara izveidi, lai jūs varētu viegli automatizēt savas LinkedIn ziņas. Viņi risina lietas klusi un aiz slēgtām durvīm.


Es to saprotu, es tiešām saprotu.


Cilvēki vēlas pieejamu, viegli lietojamu sistēmu, kas ļaus viņiem izveidot uzticamas un sarežģītas darbplūsmas ar reāliem biznesa rezultātiem. Es gribu daudzas lietas. Dzīvības eliksīrs. Izaug par dažiem centimetriem garāks. Kļūsti par tenisa čempionu manā sporta klubā. Visticamāk, ka es kļūšu par garo vietējo tenisa čempionu ar mūžīgu jaunību, nekā kāds no šiem aģentu ietvariem darbosies vidusmēra lietotājam, un ticiet man un ikvienam, kurš ir redzējis mani spēlējam tenisu, kad es saku, ka tas ir ārkārtīgi maz ticams.


Aģentiskās sistēmas ir mēģinājums izveidot WYSIWYG vietņu veidotāju, pirms vēl esam vienojušies par vienotu HTML standartu. Tie ir priekšlaicīgi.


Tas nav gadījums, kad rati ir pirms zirga; tas mēģina uzbūvēt raķešu kuģi, pirms esam atklājuši elektrību. Oportūnistiska zemes sagrābšana, kas jau ir izdevusies.

Abstrakciju slāņi

Salauzts instruments.


Problēma ar tāda rīka vai sistēmas nodrošināšanu, kas ļauj abstrakti funkcionalitāti, ir tā, ka tam ir pievienots pieņēmumu kopums. Kad es pērku āmuru, es pieņemu, ka tas darbosies. Kad es pērku spiediena tīrītāju, es pieņemu, ka tas darbosies.


Problēma ir tāda, ka, izmantojot sistēmu, es pieņemu, ka tā darbosies. Bet tas ir burtiski neiespējami, ņemot vērā pamatā esošās tehnoloģijas briedumu. Agentic Frameworks ir tālu no tā, ka arvien vairāk tiek izmantota, un tā pārdod ilūziju papildus ļoti kontrolētām demonstrācijām un ierobežotiem lietošanas gadījumiem, kas nekad nedarbosies parasta lietotāja rokās (un tādu ir miljoniem...).


To radītais kaitējums ir ievērojams. Līdzīgi kā mūsdienās izstrādātāji apgūst React, pirms viņi apgūst JavaScript, vai pieņem ietvarus pirms programmēšanas principu apguves. Entuziasma pilnu tehnologu paaudze lec ažiotāžas vilcienā, lai apgūtu “x” ietvaru. Lūk, lieta; tas nedarbosies (kādam saprātīgam standartam), patiesībā demo vai prototipa izveidošana ir diezgan liels sasniegums pats par sevi.


Bet tas nenozīmē, ka Gen AI vai LLM "nedarbojas", lai gan īstermiņā tas kļūs par pieņēmumu. Tas vienkārši nozīmē, ka mēs neesam sasnieguši pamatā esošās tehnoloģijas brieduma līmeni, lai varētu tai droši veidot stabilas abstrakcijas. Ir pārāk daudz problēmu, ko vispirms atrisināt. Dažas būtiskas problēmas, kas LLM pakalpojumu sniedzējiem ir jāatrisina padziļinātā līmenī, ietver, bet neaprobežojas ar:

Latentums

Pieejamība

Drošība

Uzticama izvade

Mērogs


Tātad, jā, es saku, ka pamatā esošās API bieži vien ir pārslogotas ar lietojumu; tie ir lēni, neaizsargāti pret uzlaušanu (īpaši tūlītēju uzlaušanu) un katru nedēļu ievieš būtiskas izmaiņas. Īstie novatori smagi strādā aiz slēgtām durvīm pie šīm problēmām. Bet, kamēr nebūsim progresējuši, vēlam veiksmi uzticamas ražošanas sistēmas veidošanā, vēl jo mazāk ietvaru izveidē.


Ja jums nav izpratnes par pamatā esošajām API (kas, starp citu, ir patiesais vērtīgais sasniegums, ar kuru mēs visi strādājam), kā jūs varat izveidot sistēmu papildus? Dažām API nav jāsaprot to ierobežojumi galvenokārt tāpēc, ka tās ir melnā kaste, kas vienkārši darbojas. Paies gadi, ja ne viena paaudze, lai LLM sasniegtu šo brieduma līmeni, līdz tam vajadzētu būt ar brīdinājuma zīmi "Produkcijas izmantošana tikai ekspertiem".


Nav iespējams izveidot uzticamu abstrakciju virs mainīgām smiltīm. Faktiski tas pārkāpj datorprogrammēšanas pamatprincipu. Abstrakcija datorzinātnēs ir process, kurā tiek noņemti elementi, kas novērš uzmanību no svarīgākiem elementiem. Mēs nevaram koncentrēties uz augsta līmeņa detaļām, ja zemā līmeņa sistēma nav uzticama; mums ir jāsaprot nianses un lietošana sarežģītas paradigmas ietvaros. Nav zema/bez koda burvju ietvars (ar fantastiskām abstrakcijām).


Tas mūs iedzen vilšanās slānī, kas, lai gan pati par sevi nav problēma, jo nodrošina vietu patiesi vērtīgu lietu veidošanai, joprojām rada vilšanos novērot.

Lielākais triks

Riteņa izgudrošana juras laikmetā.


Lielākais triks, ko Agentic AI ietvars jebkad ir izdevies, ir pārliecināt jūs, ka tie ir nepieciešami. Viņi ir LLM ainavas velns.


Jums nav vajadzīgas komandas, aģenti, vēstures stāsti un skaistas grafiskas saskarnes, kas parāda lietas, kas nekad nedarbosies.


Jums jāsaprot, ka LLM ir spēcīgi instrumenti, kas jums jāsaprot bez stāstiem no fantāzijas romāna. Jūsu Hello World un demonstrācijas lietotnes ir jāveido manuāli, izmantojot kodu. Kad sapratīsit, kā, kāpēc un ko, kā arī varat kontrolēt Gen AI modeļu ievades un izvades, jums būs pamats, lai dotos pasaulē un izveidotu kaut ko noderīgu. Un tas, iespējams, prasīs kādu laiku.


Ne ar burvjiem un menedžeriem, aģentiem un pūķiem, bet gan ar precīziem deterministiskiem izrāviena AI lietojumiem.


Sākotnēji publicēts: https://tyingshoelaces.com/blog/agentic-framework-lie