Il lancio da parte della Cina di DeepSeek di DeepSeek-R1 , un modello di ragionamento completamente open source e con licenza del MIT, un forte contendente di o1 di OpenAI , ha fatto scalpore sui media e nelle sale riunioni in quella che è stata definita la storia di Davide e Golia.
L'intelligenza artificiale sta emergendo come il nuovo campo di battaglia per le potenze globali per dimostrare il loro predominio. Pochi giorni dopo che Trump ha annunciato 500 miliardi di dollari per la costruzione di infrastrutture di intelligenza artificiale negli Stati Uniti, generando oltre 100.000 posti di lavoro, la startup cinese DeepSeek ha lanciato R1 sfidando il modello di OpenAI.
E gli sviluppatori lo adorano . Contrariamente all'ecosistema chiuso di OpenAI, è possibile modificare DeepSeek-R1 a proprio piacimento, che si tratti di business o di ricerca.
*"Stiamo vivendo in una linea temporale in cui un'azienda non statunitense mantiene viva la missione originale di OpenAI: una ricerca veramente aperta e di frontiera che dà potere a tutti", * — Jim Fan, responsabile della ricerca senior e responsabile dell'intelligenza artificiale incarnata (GEAR Lab) presso NVIDIA
"Stiamo vivendo in una linea temporale in cui un'azienda non statunitense mantiene viva la missione originale di OpenAI : una ricerca veramente aperta e di frontiera che dà potere a tutti", ha detto ad AIM Jim Fan , responsabile della ricerca senior e responsabile dell'intelligenza artificiale incarnata (GEAR Lab) presso NVIDIA.
"Il nostro obiettivo è esplorare il potenziale degli LLM per sviluppare capacità di ragionamento senza dati supervisionati, concentrandosi sulla loro autoevoluzione attraverso un processo RL puro", ha citato AIM il team DeepSeek.
La comunità dell'intelligenza artificiale è sicuramente vigile e sta prendendo nota.
*"Questo democratizza realmente l'intelligenza artificiale e offre ai paesi che non hanno l'infrastruttura esistente un enorme balzo in avanti per sperimentare e far parte della frontiera". * — Bruce Keith, co-fondatore e CEO, InvestorAi
Bruce Keith, co-fondatore e CEO di InvestorAi , afferma: "DeepSeek R1 ha sicuramente sfidato il predominio di alcuni attori nell'ecosistema dei modelli e dei dati: OpenAI, Google e Meta ne risentiranno di più. R1 avrà un impatto significativo sul panorama dell'IA. L'annuncio sottolinea l'importanza dell'innovazione e della focalizzazione sulle applicazioni e sui dati, piuttosto che solo sulla potenza di elaborazione. Ciò democratizza realmente l'IA e offre ai paesi che non hanno l'infrastruttura esistente un enorme balzo in avanti per sperimentare e far parte della frontiera".
Nel giro di pochi giorni, il modello di intelligenza artificiale cinese ha sconvolto il settore, superando o1 di OpenAI, detronizzando ChatGPT nell'App Store , mentre la capitalizzazione di mercato di NVIDIA è crollata di 589 miliardi di dollari . A differenza dell'ecosistema chiuso di OpenAI, DeepSeek-R1 è open source, gratuito e radicalmente efficiente. Raggiunge prestazioni all'avanguardia senza richiedere enormi cluster GPU, costringendo il settore a ripensare alla corsa agli armamenti ad alto costo nell'intelligenza artificiale.
Donald Trump lo ha già definito un “campanello d’allarme” per le aziende americane di intelligenza artificiale.
La startup cinese di intelligenza artificiale ha scatenato onde d'urto nella Silicon Valley, mettendo in discussione il dominio della big tech statunitense nel mercato dell'intelligenza artificiale. Costruito interamente su tecnologia open source e chip di fascia bassa, DeepSeek aggira la necessità di hardware di fascia alta limitato dai controlli sulle esportazioni statunitensi e afferma di aver sviluppato il modello per soli 5,6 milioni di dollari . Di conseguenza, DeepSeek è disponibile a un costo che è solo il 2% di quello che gli utenti spenderebbero per il modello O1 di OpenAI.
*“DeepSeek non è il primo modello open source, ma la sua licenza MIT e il modello di pensiero R1 si distinguono per la loro accuratezza e i bassi costi di formazione, democratizzando l'accesso all'intelligenza artificiale avanzata, sia localmente che tramite API accessibili, guidando così l'innovazione.” * — Christian Struve, co-fondatore e CEO di Fracttal
“DeepSeek non è il primo modello open source, ma la sua licenza MIT e il modello di pensiero R1 si distinguono per la loro accuratezza e i bassi costi di formazione, democratizzando l'accesso all'intelligenza artificiale avanzata, sia localmente che tramite API accessibili, guidando così l'innovazione.”
Christian Struve , cofondatore e CEO di Fracttal .
*“DeepSeek si è posizionato molto facilmente allo stesso livello di Meta come un buon concorrente dei grandi nomi per il modello “vincente” (prevalente) nel mondo delle applicazioni basate sull’intelligenza artificiale.” * — JD Raimondi Responsabile della scienza dei dati presso Making Sense
"DeepSeek ha preso l'iniziativa che Meta aveva preso internamente: competere con i grandi modelli privati con modelli pubblici che possono essere utilizzati da tutti a basso costo. Ma il differenziatore di DeepSeek con r1 è nuovo: oltre a essere gratuito, è efficiente, a basso costo e con prestazioni paragonabili ai grandi (GPT o1, GPT o4). DeepSeek si è posizionato molto facilmente allo stesso livello di Meta come un buon concorrente dei grandi per il modello "vincente" (prevalente) nel mondo delle applicazioni basate sull'intelligenza artificiale", afferma JD Raimondi, responsabile della scienza dei dati presso Making Sense .
Il fatto che abbiano creato questa piattaforma con investimenti inferiori a 6 milioni di dollari ha scosso i CEO del settore tecnologico a livello mondiale, sottolineando che le innovazioni rivoluzionarie non necessitano necessariamente di investimenti da miliardi di dollari.
"Tuttavia, dal punto di vista della domanda/offerta, il mercato delle GPU dominato da Nvidia è ancora lontano dal raggiungere il picco della domanda", aggiunge Bruce Keith.
Ma DeepSeek non è esente da controversie. L'applicazione sta sollevando questioni come la privacy dei dati, la sicurezza nazionale e le implicazioni geopolitiche. L'informativa sulla privacy di DeepSeek conferma che i dati degli utenti sono archiviati in Cina. L'ex ministro indiano dell'IT Rajeev Chandrasekhar, uno dei politici esperti di tecnologia dell'India, ha già chiesto se DeepSeek sia il TikTok dell'IA.
“…è fondamentale analizzare in dettaglio le sue opportunità e sfide, così come il suo reale potenziale per guidare la trasformazione digitale dei nostri clienti.” — Harold Barber, COO e CFO di Escala 24×7
"DeepSeek sta sconvolgendo il mercato dell'IA con una proposta innovativa che sfida i principali attori del settore e potrebbe trasformare radicalmente il modo in cui le aziende accedono e utilizzano questa tecnologia. Tuttavia, è fondamentale analizzare in dettaglio le sue opportunità e sfide, nonché il suo reale potenziale per guidare la trasformazione digitale dei nostri clienti", avverte Harold Barber , COO e CFO di Escala 24×7 .
La Marina degli Stati Uniti ha già vietato DeepSeek .
Tuttavia, pur essendo open source, la versione cinese dell'IA funziona con una rigida censura e non risponde a domande politicamente sensibili. Allo stesso tempo, la sua natura open source consente agli sviluppatori di eseguirla localmente, senza restrizioni , un formidabile punto a suo favore.
Paramdeep Singh, co-fondatore di Shorthills AI , afferma che DeepSeek cambia completamente la narrazione della GenAI.
"È come se Davide avesse sconfitto Golia. La vecchia storia di GenAI era che solo i grandi modelli potevano vincere. Richiedeva competenze super specializzate, un'enorme capacità di calcolo, migliaia di GPU di ultima generazione, dati su scala web, trilioni di nodi e un'enorme quantità di elettricità per addestrare un modello di linguaggio fondamentale. Tutto ciò si traduceva in milioni di dollari per addestrare il modello. Ciò significava che aziende e paesi con tasche profonde avrebbero monopolizzato quel mercato.
"È come se Davide avesse sconfitto Golia. La vecchia storia di GenAI era che solo i grandi modelli potevano vincere... Ora abbiamo Deepseek che ha completamente capovolto questa storia. Abbiamo un gestore di hedge fund che rilascia un modello che batte i grandi papà di GenAI su tutti i parametri", — Paramdeep Singh, co-fondatore di Shorthills AI
"Ora abbiamo Deepseek che ha completamente capovolto questa storia. Abbiamo un gestore di hedge fund che rilascia un modello che batte i grandi papà di GenAI su tutti i parametri. Il modello è frugale e addestrato sulla capacità di riserva delle GPU che erano inutilizzate. Il modello è così piccolo che può letteralmente essere eseguito sul tuo browser. È semplicemente il modello con il miglior rapporto qualità-prezzo. Abbiamo un raggio di speranza in cui l'addestramento e l'uso del Large Language Model possono essere democratizzati. Non sono le persone sedute nelle torri d'avorio, ma il talento con hardware frugale che può addestrare il modello migliore. Amiamo tutti questa storia di Davide contro Golia", afferma.
*"La corsa all'IA non sarà vinta creando il modello più sofisticato; sarà vinta incorporando l'IA nei sistemi aziendali per generare un valore economico tangibile. La leadership globale nell'IA dovrebbe essere misurata dalla sua applicazione, non solo dalla sua invenzione." * — Mike Capone, CEO di Qlik
La bellezza di DeepSeek risiede nella sua capacità di aiutare e non solo stupire. Come afferma Mike Capone , CEO di Qlik , "La corsa all'IA non sarà vinta creando il modello più sofisticato; sarà vinta incorporando l'IA nei sistemi aziendali per generare un valore economico tangibile. La leadership globale nell'IA dovrebbe essere misurata dalla sua applicazione, non solo dalla sua invenzione".
E la storia della gloria continua. DeepSeek ha appena annunciato Janus Pro , un modello di immagine AI che rivaleggia con DALL·E 3 di OpenAI. Se, o forse dovremmo dire quando, DeepSeek entrerà nella generazione video, concorrenti come Veo di Google e Sora di OpenAI potrebbero essere nei guai.
Nel frattempo, Alibaba ha rilasciato il suo modello Qwen 2.5 AI che, a suo dire, supera DeepSeek . La pressione non è solo sulle grandi aziende tecnologiche o solo sugli Stati Uniti, ma anche sui player più piccoli e su paesi come l'India.
Navanwita Bora Sachdev , redattrice, The Tech Panda