Puțini oameni înțeleg cu adevărat schimbarea revoluționară care se desfășoară în fața ochilor lor atunci când vine vorba de AI. Nu numai că instrumentele și software-ul nostru au devenit mai inteligente - este că am început să dezvoltăm software-ul într-un mod complet nou.
Acest lucru este de înțeles, desigur, deoarece nu a existat nicio schimbare dramatică în hardware sau software. programele noastre rulează încă pe CPU-uri și GPU-uri digitale și sunt încă scrise în limbajele tradiționale de programare, cum ar fi Python.
Merită să aruncăm o privire la codul sursă al unor modele lingvistice mari, cum ar fiPNL-2,Grocăsau de metaLLaMAChiar și pentru un laic, un lucru surprinzător este cât de scurt și relativ simplu este acest cod – ceea ce este surprinzător, având în vedere cunoștințele vaste și inteligența de rezolvare a problemelor pe care aceste modele le posedă.
săÎntr-un sistem de inteligență artificială, codul de execuție este doar o parte marginală a sistemului - cunoștințele și inteligența reală provin din setul de date utilizat pentru instruire.
să
Într-un sistem de inteligență artificială, codul de execuție este doar o parte marginală a sistemului - cunoștințele și inteligența reală provin din setul de date utilizat pentru instruire.
Acesta este motivul pentru care această nouă formă de software a fost numităSoftware-ul 2.0de Andrej Karpathy – și cred că este un nume foarte potrivit.
Sursă deschisă ≠ Open Source
Există mai multe modele cu sursă deschisă pe care oricine le poate descărca, rula sau chiar modifica.Exemple includ LLaMA, Grok și recentul model chinezesc DeepSeek.
Aceste modele constau, de obicei, din câteva fișiere Python și mai multe matrice masive de greutate (fiecare cu mai multe gigabytes în dimensiune).În timp ce este adevărat că aceste modele pot fi dezvoltate în continuare - fine-tuned, cuantizat, distilat, și așa mai departe - ele încă nu pot fi considerate cu adevărat open-source în sensul clasic.
Este mai corect să se numească acesteopen-weight modelsmai degrabă decât modelele open-source, deoarece componenta cu adevărat valoroasă – datele de instruire – rămâne în mâinile companiilor de publicare (Meta, xAI, etc.).
săAdevărata inteligență artificială cu sursă deschisă se bazează pe date deschise.
să
Adevărata inteligență artificială cu sursă deschisă se bazează pe date deschise.
Cine deține datele?
Modelele lingvistice mari sunt construite de obicei prin crearea uneiModelul FundațieiAcest model de fundație este instruit pe date produse de omenire și puse la dispoziția publicului – prin site-uri web, cărți, videoclipuri YouTube și social media. Deoarece această bogăție de date este rezultatul muncii noastre colective, ar fi logic să tratăm aceste seturi de date ca resurse de domeniu public, accesibile gratuit tuturor.
Din acest motiv, multe servicii au decis în mod explicit să interzică dezvoltatorilor de modele AI să utilizeze conținutul lor.
Personal, nu sunt pe deplin de acord cu această abordare, deoarece cred că împiedică progresul.fair-use modelcare permite utilizarea datelor disponibile public pentru instruirea AI – cu condiția ca setul de date și modelul rezultat să fie făcute accesibile în mod liber în schimb.
Deoarece nu există în prezent un cadru juridic ca acesta și nu există niciun stimulent pentru companiile AI să dezvolte modele cu adevărat open-source, această responsabilitate revine comunității.
Stocarea descentralizată – casa ideală pentru seturile de date deschise
Dar cum ar arăta într-adevăr un set de date deschis construit de o comunitate globală? Aceasta este departe de o întrebare trivială, deoarece există diferențe ideologice și culturale semnificative între oameni din diferite regiuni ale lumii. Din acest motiv, este imposibil să se creeze un singur set de date din cunoștințele globale disponibile public pe care toată lumea ar fi de acord.
Având în vedere aceste criterii, cea mai bună alegere este un sistem de stocare descentralizat imuabil, cum ar fi:IPFSsauEthereum SwarmAceste soluții utilizează conținut-adresarea (în cazul în care adresa datelor este un hash generat din conținutul lor), ceea ce face modificarea neautorizată a conținutului practic imposibilă.
Aceste sisteme au o altă caracteristică extrem de utilă: stochează conținutul în blocuri.Deoarece adresa unei bucăți de conținut este derivată din hash-ul său, dacă același bloc apare în mai multe fișiere, acesta trebuie să fie stocat o singură dată.Git repository, unde versiunea este automată, iar forjarea este ieftină. Acest lucru este ideal în cazurile în care vrem să stocăm mai multe seturi de date care diferă doar ușor (de exemplu, cu mai puțin de 1%). Dacă cineva nu este de acord cu conținutul unui set de date, pot crea o nouă versiune fără a fi nevoie să facă o copie completă - doar modificările sunt stocate. Exact ca atunci când forjăm un proiect pe GitHub pentru a modifica ceva.
Cum blockchain-ul poate sprijini crearea de seturi de date deschise
Blockchain și stocarea descentralizată se completează bine. Pe de o parte, stocarea descentralizată face posibilă stocarea unor cantități mari de date cu un nivel de securitate comparabil cu stocarea blockchain. Pe de altă parte, blockchain poate oferi sistemul de stimulare și stratul de guvernanță pentru stocarea descentralizată. Un bun exemplu este Ethereum Swarm, care nu ar putea funcționa fără o blockchain, deoarece sistemul său de stimulare - esențial pentru funcționarea optimă a rețelei - este implementat prin contracte inteligente care rulează pe blockchain.
În cazul seturilor de date deschise, DAO-urile bazate pe blockchain ar putea decide ce este inclus într-un set de date. Sistemul ar putea funcționa similar cu Wikipedia, unde administratorii se asigură că informațiile false nu le introduc în enciclopedie.
Dacă cineva nu este de acord cu conținutul unui set de date, își poate crea propria fork și poate lansa un nou DAO pentru a gestiona versiunea alternativă.
Formare descentralizată
Dacă datele sunt noul cod sursă, atunci în cazul Software 2.0 (inteligență artificială), instruirea este echivalentă cu compilarea programului.În dezvoltarea tradițională a software-ului, această compilare se face local de către dezvoltatori pe propriile mașini.În sistemele AI, totuși, instruirea este o sarcină extrem de intensă în ceea ce privește energia și calculul.
O opțiune este ca comunitatea să strângă fonduri și să închirieze puterea de calcul de la un furnizor de cloud pentru formare centralizată.O altă posibilitate este formarea descentralizată, în care membrii donă capacitatea de calcul fie gratuit (ca bun public), fie în schimbul unei compensații.
Cu toate acestea, formarea descentralizată este departe de a fi o sarcină trivială. O provocare este că modelele mari nu pot fi instruite pe un singur nod - este necesară formarea cu mai multe noduri, care necesită o comunicare de mare volum între noduri. Această comunicare trebuie optimizată pentru ca formarea să fie eficientă. Din fericire, mai multe start-up-uri lucrează la această problemă.Exo Labscare a dezvoltat un protocol numitdialectică, conceput pentru a permite formarea pe o rețea de noduri conectate la internet.
O altă provocare – comună tuturor sistemelor descentralizate deschise (blockchain-uri, stocare descentralizată etc.) – este problematrustDeoarece oricine își poate contribui liber propriile dispozitive la sistem, nu există nicio garanție că vor acționa onest.Un actor rău intenționat, de exemplu, ar putea utiliza date neautorizate în loc de setul de date aprobat de DAO, „contaminând” astfel modelul.
În aceste sisteme, încrederea este înlocuită cu garanții computaționale.Cu cât vrem mai multă securitate într-o rețea de noduri neîncrezătoare, cu atât este nevoie de mai multă putere computațională.Un bun exemplu al acestui lucru este blockchain, unde fiecare nod care publică un nou bloc validă, de asemenea, toate calculele din lanțul care conduc la acesta.
Această abordare, totuși, nu funcționează pentru formarea AI, așa că trebuie să explorăm alte soluții.
Validarea bazată pe consens
O abordare este de a avea fiecare calcul efectuat de mai multe (de exemplu, trei) noduri selectate la întâmplare. Dacă rezultatele nu se potrivesc, nodul necinstit își pierde depozitul implicat. Avantajul acestei metode este că oferă o securitate relativ mare. Dezavantajul este că triplează puterea de calcul necesară.
Dovada cunoaşterii zero
Cu tehnologia Zero Knowledge Proof (ZKP), se poate dovedi că un calcul a fost efectuat – și se poate face într-un mod în care dovada în sine este ieftină de verificat. Această tehnică este utilizată în sisteme precum zkRollups, unde un zkSNARK dovedește că tranzacțiile valabile au fost executate pe un lanț Layer 2. Dezavantajul este că generarea dovezii este costisitoare din punct de vedere computațional, mai ales că numărul de multiplicări în calcul crește. Acest lucru înseamnă că, cu tehnologia actuală ZKP, instruirea modelelor AI în acest fel ar necesita mult mai multă putere de calcul.
Optimizarea învățării automate descentralizate
Învățarea automată descentralizată optimistă funcționează în mod similar cu rolurile optimiste. Calculul este presupus a fi corect, cu excepția cazului în care cineva prezintă o dovadă de fraudă pentru a arăta altfel. În practică, nodul de instruire înregistrează fiecare pas al procesului - inclusiv matricea de greutate inițială, datele de instruire și matricea de greutate rezultată. Dacă înregistrarea înregistrează, de asemenea, semințele aleatorii, întregul calcul devine determinist și reproductibil.
Nodurile de validare pot apoi să preleveze în mod aleatoriu segmente din jurnalul de instruire și să le verifice. Dacă se găsesc orice inconsecvențe, nodul de instruire își pierde interesul. Această metodă are cel mai mic cost de calcul: nu necesită generarea de dovezi costisitoare de zero cunoștințe și, spre deosebire de validarea bazată pe consens, numai părțile selectate aleatoriu ale calculului trebuie să fie verificate din nou.
În cele din urmă, formarea descentralizată necesită o „piață nodală” – o platformă în care resursele de calcul disponibile pot fi descoperite și utilizate.Cloudul Aleph, care, la fel ca alți furnizori de cloud, oferă capacitate de calcul - dar este o platformă descentralizată concepută pentru a oferi servicii de stocare scalabile, de calcul și de baze de date printr-o rețea de noduri distribuite.
Inferența descentralizată
Pentru modelele la scară largă, nu numai că formarea nu este trivială datorită cerințelor de calcul ridicate, dar rularea modelului (inferența) este, de asemenea, provocatoare. Acest lucru este valabil mai ales pentru modelele de raționament, unde rezultatele apar numai după mai multe treceri consecutive înainte - ceea ce înseamnă că puterea totală de calcul necesară pentru inferență poate depăși cu mult puterea de formare.
Deoarece funcționarea unei rețele neuronale funcționează în același mod ca și în timpul instruirii (inferența este fazele înainte, în timp ce instruirea implică multe faze înainte și înapoi), învățarea automată descentralizată optimistă poate fi, de asemenea, aplicată aici.
Tehnologiile precum criptarea omomorfică și calculul multipartit (MPC) pot ajuta la protejarea datelor private.În același timp, performanța hardware-ului continuă să crească exponențial, iar noile tehnici - cum ar fi rețelele neuronale de 1,5 biți și modelele MoE distilate, cum ar fi DeepSeek - fac din ce în ce mai posibilă rularea acestor rețele locală.
Cred că, pe termen lung, vom putea rula astfel de modele la nivel local - sau cel puțin, în medii de încredere închiriate privat.
Concluzie
Până acum, este clar pentru majoritatea oamenilor că AI va aduce schimbări revoluționare. va remodela lumea noastră în moduri pe care le putem imagina cu greu - și asta fără să menționăm impactul roboților humanoizi.
Acest lucru pune o întrebare centrală pentru viitorul nostru: va apărea cu adevărat AI descentralizată?
Construirea unui astfel de sistem necesită mai mult decât inovație tehnică - necesită seturi de date deschise, stocare descentralizată, guvernanță bazată pe blockchain și mecanisme de stimulare care să permită comunităților să contribuie și să colaboreze în mod liber.
Dacă vom reuși, nu vom democratiza doar IA – vom pune bazele unei noi comunități digitale, în care inteligența însăși este co-creată, transparentă și deschisă tuturor.