Lansarea DeepSeek în China a DeepSeek-R1 , un model de raționament complet open-source, licențiat de MIT, un concurent puternic la o1 de la OpenAI , se răsfrânge în media și în sălile de consiliu în ceea ce se numește povestea lui David-Goliath.
AI a apărut ca noul câmp de luptă pentru ca puterile globale să-și arate dominația. La câteva zile după ce Trump a anunțat 500 de miliarde de dolari în construirea infrastructurii AI în SUA, generând peste 100.000 de locuri de muncă, startup-ul chinez DeepSeek a lansat R1, provocând modelul OpenAI.
Și dezvoltatorilor le place . În contrast cu ecosistemul închis al OpenAI, se poate modifica DeepSeek-R1 pentru confortul propriu, fie că este vorba de afaceri sau de cercetare.
*„Trăim într-o linie temporală în care o companie din afara Statelor Unite menține în viață misiunea inițială a OpenAI – cercetare cu adevărat deschisă, de frontieră, care dă putere pe toți”, * – Jim Fan, manager senior de cercetare și conducător al IA încorporată (GEAR Lab) la NVIDIA
„Trăim într-o linie temporală în care o companie din afara Statelor Unite menține în viață misiunea inițială a OpenAI – o cercetare cu adevărat deschisă, de frontieră, care îi dă putere pe toți”, a declarat pentru AIM Jim Fan , manager senior de cercetare și lider al IA încorporată (GEAR Lab) la NVIDIA.
„Scopul nostru este de a explora potențialul LLM-urilor de a dezvolta capacități de raționament fără date supravegheate, concentrându-ne pe auto-evoluția lor printr-un proces pur RL”, a citat AIM echipa DeepSeek.
Comunitatea AI cu siguranță se ridică și ia în seamă.
* „Acest lucru democratizează cu adevărat inteligența artificială și oferă țărilor care nu au infrastructura existentă un salt uriaș înainte pentru a experimenta și a face parte din frontieră.” * — Bruce Keith, co-fondator și CEO, InvestorAi
Bruce Keith, co-fondator și CEO, InvestorAi , spune: „DeepSeek R1 a contestat cu siguranță dominația câtorva jucători în ecosistemul de modele și date – OpenAI, Google și Meta vor simți cel mai mult. R1 va avea un impact semnificativ asupra peisajului AI. Anunțul arată importanța inovației și concentrarea pe aplicații și date, mai degrabă decât doar pe puterea de procesare. Acest lucru democratizează cu adevărat inteligența artificială și oferă țărilor care nu au infrastructura existentă un salt uriaș înainte pentru a experimenta și a face parte din graniță.”
În câteva zile, modelul AI construit în China a răsturnat industria, depășind OpenAI o1, detronând ChatGPT în App Store , în timp ce capitalizarea pieței NVIDIA a scăzut cu 589 miliarde USD . Spre deosebire de ecosistemul închis al OpenAI, DeepSeek-R1 este open source, gratuit de utilizat și extrem de eficient. Obține performanțe de ultimă generație fără a necesita clustere masive de GPU, forțând industria să regândească cursa înarmărilor cu costuri ridicate în AI.
Donald Trump l-a numit deja „un apel de trezire” pentru companiile americane de inteligență artificială.
Startup-ul chinezesc AI a trimis unde de șoc prin Silicon Valley, punând sub semnul întrebării dominația tehnologică a SUA pe piața AI. Construit în întregime pe tehnologie open-source și cipuri de calitate inferioară, DeepSeek ocolește nevoia de hardware de ultimă generație restricționat de controalele exporturilor din SUA și susține că a dezvoltat modelul pentru doar 5,6 milioane USD . Ca rezultat, DeepSeek este disponibil la un cost care reprezintă doar 2% din ceea ce ar cheltui utilizatorii pe modelul OpenAI O1.
*„DeepSeek nu este primul model open source, dar licența sa MIT și modelul de gândire R1 se remarcă prin acuratețe și costuri reduse de instruire, democratizează accesul la AI avansate, fie local, fie prin intermediul API-urilor accesibile, stimulând astfel inovația.” * — Christian Struve, cofondator și CEO al Fracttal
„DeepSeek nu este primul model open source, dar licența sa MIT și modelul de gândire R1 se remarcă prin acuratețea și costul redus de instruire, democratizând accesul la IA avansată, fie local, fie prin intermediul API-urilor accesibile, stimulând astfel inovația.”
Christian Struve , cofondator și CEO al Fracttal .
*„DeepSeek s-a poziționat foarte ușor la același nivel cu Meta ca un bun concurent al băieților mari pentru modelul „câștigător” (prevalent) în lumea aplicațiilor bazate pe inteligență artificială.” * — JD Raimondi Head of Data Science la Making Sense
„DeepSeek a luat inițiativa pe care Meta a luat-o pe plan intern: a concura cu marile modele private cu modele publice care pot fi folosite de toată lumea la costuri reduse. Dar diferențiatorul DeepSeek cu r1 este unul nou: pe lângă faptul că este gratuit, este eficient, cu costuri reduse și cu performanțe comparabile cu băieții mari (GPT o1, GPT o4). DeepSeek s-a poziționat foarte ușor la același nivel cu Meta ca un bun concurent al băieților mari pentru modelul „câștigător” (prevalent) în lumea aplicațiilor bazate pe inteligență artificială”, spune JD Raimondi, șeful Data Science la Making Sense .
Faptul că au creat această platformă cu investiții sub 6 milioane USD i-a zguduit pe directorii generali de tehnologie la nivel global, subliniind că inovațiile care schimbă jocul nu au neapărat nevoie de investiții de miliarde de dolari.
„Cu toate acestea, din perspectiva ofertei/cererii, piața de GPU pe care o domină Nvidia este încă departe de a atinge vârful cererii”, adaugă Bruce Keith.
Dar DeepSeek nu este lipsit de controverse. Aplicația ridică întrebări precum confidențialitatea datelor, securitatea națională și implicațiile geopolitice. Politica de confidențialitate a DeepSeek confirmă faptul că datele utilizatorilor sunt stocate în China. Fostul ministru indian al IT Rajeev Chandrasekhar, unul dintre politicienii indieni cunoscători de tehnologie, a întrebat deja dacă DeepSeek este TikTok al AI.
„… este crucial să analizăm în detaliu oportunitățile și provocările sale, precum și potențialul real de a conduce transformarea digitală a clienților noștri.” — Harold Barber, COO și CFO la Escala 24×7
„DeepSeek perturbă piața AI cu o propunere inovatoare care provoacă principalii jucători din zonă și ar putea transforma radical modul în care companiile accesează și utilizează această tehnologie. Cu toate acestea, este crucial să analizăm în detaliu oportunitățile și provocările sale, precum și potențialul real de a conduce transformarea digitală a clienților noștri”, avertizează Harold Barber , COO și CFO la Escala 24×7 .
Marina SUA a interzis deja DeepSeek .
Totuși, deși este open source, versiunea chineză a AI funcționează cu o cenzură strictă și nu răspunde la întrebări sensibile din punct de vedere politic. În același timp, natura sa open-source permite dezvoltatorilor să o ruleze local, fără restricții , un punct formidabil în favoarea sa.
Paramdeep Singh, co-fondator al Shorthills AI , spune că DeepSeek schimbă narațiunea GenAI completă.
„Este ca și cum David l-ar fi învins pe Goliat. Vechea poveste GenAI era că doar modelele mari puteau câștiga. A necesitat abilități super-specializate, calcul uriaș, mii de cele mai recente GPU-uri, date la scară web, trilioane de noduri și o cantitate imensă de energie electrică pentru a antrena un model de limbaj de bază. Toate acestea s-au tradus în milioane de dolari pentru a antrena modelul. Asta însemna că companiile și țările cu buzunare adânci urmau să monopolizeze această piață.
„Este ca și cum David l-ar fi învins pe Goliat. Vechea poveste GenAI era că doar modelele mari puteau câștiga... Acum avem Deepseek care a schimbat complet această poveste. Avem un manager de fonduri speculative care lansează un model care îi depășește pe marii tați ai GenAI la toți parametrii”, – Paramdeep Singh, co-fondator al Shorthills AI
„Acum avem Deepseek care a schimbat complet această poveste. Avem un manager de fond speculativ care lansează un model care îi învinge pe marii tați ai GenAI la toți parametrii. Modelul este frugal și instruit pe capacitatea de rezervă a GPU-urilor care stăteau inactiv. Modelul este atât de mic încât poate rula literalmente pe browser. Este pur și simplu cel mai bun model raport calitate-preț. Avem o rază de speranță în care instruirea și utilizarea modelului de limbă mare pot fi democratizate. Nu oamenii care stau în turnuri de fildeș, ci talentul cu feronerie frugală poate antrena cel mai bun model. Cu toții ne place această poveste David vs Goliat”, spune el.
*„Cursa AI nu va fi câștigată prin crearea celui mai sofisticat model; va fi câștigat prin încorporarea AI în sistemele de afaceri pentru a genera valoare economică tangibilă. Conducerea globală în IA ar trebui măsurată prin aplicarea sa, nu doar prin invenție.” * — Mike Capone, CEO al Qlik
Frumusețea lui DeepSeek constă în capacitatea sa de a ajuta și nu doar de wow. După cum spune Mike Capone , CEO al Qlik , „Cursa AI nu va fi câștigată prin crearea celui mai sofisticat model; va fi câștigat prin încorporarea AI în sistemele de afaceri pentru a genera valoare economică tangibilă. Conducerea globală în IA ar trebui măsurată prin aplicarea sa, nu doar prin invenție.”
Și povestea gloriei continuă. DeepSeek tocmai a anunțat Janus Pro , un model de imagine AI care rivalizează cu DALL·E 3 de la OpenAI. Dacă, sau poate ar trebui să spunem, atunci când DeepSeek intră în generarea de videoclipuri, concurenți precum Veo de la Google și Sora de la OpenAI ar putea avea probleme în continuare.
Între timp, Alibaba și-a lansat modelul Qwen 2.5 AI despre care spune că depășește DeepSeek . Presiunea este nu doar asupra tehnologiei mari sau doar a SUA, ci și asupra jucătorilor mai mici și asupra țărilor precum India.
Navanwita Bora Sachdev , editor, The Tech Panda