Le lancement par la Chine de DeepSeek de DeepSeek-R1 , un modèle de raisonnement entièrement open source sous licence du MIT, un concurrent sérieux d' o1 d'OpenAI , fait jaser dans les médias et les salles de conseil dans ce que l'on appelle une histoire de David-Goliath.
L'intelligence artificielle est devenue le nouveau champ de bataille des puissances mondiales pour démontrer leur domination. Quelques jours après que Trump a annoncé un investissement de 500 milliards de dollars dans la construction d'infrastructures d'IA aux États-Unis, générant plus de 100 000 emplois, la startup chinoise DeepSeek a lancé R1, remettant en cause le modèle d'OpenAI.
Et les développeurs adorent ça . Contrairement à l'écosystème fermé d'OpenAI, chacun peut modifier DeepSeek-R1 selon son propre confort, que ce soit pour les affaires ou la recherche.
*« Nous vivons à une époque où une entreprise non américaine maintient en vie la mission originale d'OpenAI : une recherche véritablement ouverte et de pointe qui donne du pouvoir à tous », * — Jim Fan, directeur de recherche senior et responsable de l'IA incarnée (GEAR Lab) chez NVIDIA
« Nous vivons à une époque où une entreprise non américaine maintient en vie la mission originale d' OpenAI : une recherche véritablement ouverte et de pointe qui donne du pouvoir à tous », a déclaré à AIM Jim Fan , directeur de recherche senior et responsable de l'IA incarnée (GEAR Lab) chez NVIDIA.
« Notre objectif est d'explorer le potentiel des LLM pour développer des capacités de raisonnement sans aucune donnée supervisée, en nous concentrant sur leur auto-évolution grâce à un processus RL pur », a déclaré l'équipe DeepSeek à AIM.
La communauté de l’IA est certainement en train de réagir et d’en prendre note.
*« Cela démocratise véritablement l'IA et donne aux pays qui ne disposent pas de l'infrastructure nécessaire un énorme pas en avant pour expérimenter et faire partie de la frontière. » * — Bruce Keith, cofondateur et PDG d'InvestorAi
Bruce Keith, cofondateur et PDG d'InvestorAi , déclare : « DeepSeek R1 a clairement remis en cause la domination de quelques acteurs dans l'écosystème des modèles et des données. OpenAI, Google et Meta en ressentiront le plus les effets. R1 aura un impact significatif sur le paysage de l'IA. Cette annonce souligne l'importance de l'innovation et de la concentration sur les applications et les données plutôt que sur la seule puissance de traitement. Cela démocratise véritablement l'IA et donne aux pays qui ne disposent pas de l'infrastructure existante un énorme bond en avant pour expérimenter et faire partie de la frontière. »
En quelques jours, le modèle d'IA développé par les Chinois a bouleversé l'industrie, surpassant o1 d'OpenAI, détrônant ChatGPT dans l' App Store , tandis que la capitalisation boursière de NVIDIA a chuté de 589 milliards de dollars . Contrairement à l'écosystème fermé d'OpenAI, DeepSeek-R1 est open source, gratuit et radicalement efficace. Il atteint des performances de pointe sans nécessiter de clusters GPU massifs, obligeant l'industrie à repenser la course aux armements à coût élevé dans l'IA.
Donald Trump a déjà qualifié cela de « signal d’alarme » pour les entreprises américaines d’IA.
La start-up chinoise spécialisée dans l'intelligence artificielle a provoqué une onde de choc dans la Silicon Valley, remettant en question la domination des géants technologiques américains sur le marché de l'intelligence artificielle. Construite entièrement sur une technologie open source et des puces bas de gamme, DeepSeek évite le besoin de matériel haut de gamme limité par les contrôles à l'exportation américains et affirme avoir développé le modèle pour seulement 5,6 millions de dollars . En conséquence, DeepSeek est disponible à un coût qui ne représente que 2 % de ce que les utilisateurs dépenseraient sur le modèle O1 d'OpenAI.
*« DeepSeek n’est pas le premier modèle open source, mais sa licence MIT et son modèle de réflexion R1 se distinguent par leur précision et leur faible coût de formation, démocratisant l’accès à l’IA avancée, soit localement, soit via des API accessibles, stimulant ainsi l’innovation. » * — Christian Struve, cofondateur et PDG de Fracttal
« DeepSeek n'est pas le premier modèle open source, mais sa licence MIT et son modèle de réflexion R1 se distinguent par leur précision et leur faible coût de formation, démocratisant l'accès à l'IA avancée, soit localement, soit via des API accessibles, stimulant ainsi l'innovation. »
Christian Struve , cofondateur et PDG de Fracttal .
*« DeepSeek s'est très facilement positionné au même niveau que Meta en tant que bon concurrent des grands noms du modèle « gagnant » (prévalent) dans le monde des applications basées sur l'IA. » * — JD Raimondi Responsable de la science des données chez Making Sense
« DeepSeek a repris l’initiative que Meta avait prise en interne : concurrencer les grands modèles privés avec des modèles publics utilisables par tous à moindre coût. Mais le différenciateur de DeepSeek avec r1 est nouveau : en plus d’être gratuit, il est efficace, peu coûteux et avec des performances comparables aux grands (GPT o1, GPT o4). DeepSeek s’est très facilement positionné au même niveau que Meta comme un bon concurrent des grands pour le modèle « gagnant » (prévalent) dans le monde des applications propulsées par l’IA », explique JD Raimondi, responsable de la science des données chez Making Sense .
Le fait qu'ils aient créé cette plateforme avec des investissements inférieurs à 6 millions de dollars a ébranlé les PDG de la technologie du monde entier, soulignant que les innovations révolutionnaires ne nécessitent pas nécessairement des investissements de plusieurs milliards de dollars.
« Cependant, du point de vue de l’offre et de la demande, le marché des GPU, dominé par Nvidia, est encore loin d’atteindre son pic de demande », ajoute Bruce Keith.
Mais DeepSeek n’est pas sans controverse. L’application soulève des questions telles que la confidentialité des données, la sécurité nationale et les implications géopolitiques. La politique de confidentialité de DeepSeek confirme que les données des utilisateurs sont stockées en Chine. L’ancien ministre indien de l’informatique Rajeev Chandrasekhar, l’un des politiciens les plus férus de technologie en Inde, s’est déjà demandé si DeepSeek était le TikTok de l’IA.
« …il est essentiel d’analyser en détail ses opportunités et ses défis, ainsi que son potentiel réel pour conduire la transformation numérique de nos clients. » — Harold Barber, COO et CFO chez Escala 24×7
« DeepSeek bouleverse le marché de l’IA avec une proposition innovante qui défie les principaux acteurs du secteur et pourrait transformer radicalement la façon dont les entreprises accèdent et utilisent cette technologie. Cependant, il est crucial d’analyser en détail ses opportunités et ses défis, ainsi que son potentiel réel pour conduire la transformation numérique de nos clients », prévient Harold Barber , COO et CFO d’ Escala 24×7 .
La marine américaine a déjà interdit DeepSeek .
Cependant, bien qu'elle soit open source, la version chinoise de l'IA fonctionne avec une censure stricte et ne répond pas aux questions politiquement sensibles. En même temps, sa nature open source permet aux développeurs de l'exécuter localement, sans restrictions , un formidable atout en sa faveur.
Paramdeep Singh, co-fondateur de Shorthills AI , déclare que DeepSeek change complètement le récit de GenAI.
« C’est comme si David avait vaincu Goliath. La vieille légende de GenAI disait que seuls les grands modèles pouvaient gagner. Il fallait des compétences ultra-spécialisées, une puissance de calcul colossale, des milliers de GPU de dernière génération, des données à l’échelle du Web, des milliards de nœuds et une énorme quantité d’électricité pour former un modèle de langage fondamental. Tout cela se traduisait par des millions de dollars pour former le modèle. Cela signifiait que les entreprises et les pays aux poches bien remplies allaient monopoliser ce marché.
« C’est comme si David avait vaincu Goliath. L’ancienne histoire de GenAI était que seuls les grands modèles pouvaient gagner… Aujourd’hui, Deepseek a complètement renversé la situation. Nous avons un gestionnaire de fonds spéculatifs qui publie un modèle qui bat les grands de GenAI sur tous les paramètres », — Paramdeep Singh, cofondateur de Shorthills AI
« Nous avons maintenant Deepseek qui a complètement bouleversé cette histoire. Nous avons un gestionnaire de fonds spéculatifs qui publie un modèle qui bat les grands papas de GenAI sur tous les paramètres. Le modèle est frugal et formé sur la capacité de réserve des GPU qui étaient inutilisés. Le modèle est si petit qu'il peut littéralement fonctionner sur votre navigateur. C'est tout simplement le modèle au meilleur rapport qualité-prix. Nous avons une lueur d'espoir où la formation et l'utilisation de modèles de langage volumineux peuvent être démocratisées. Ce ne sont pas des gens assis dans des tours d'ivoire, mais des talents avec du matériel frugal qui peuvent former le meilleur modèle. Nous aimons tous cette histoire de David contre Goliath », dit-il.
*« La course à l’IA ne se gagnera pas en créant le modèle le plus sophistiqué, mais en intégrant l’IA dans les systèmes d’entreprise pour générer une valeur économique tangible. Le leadership mondial en matière d’IA doit se mesurer à son application, et pas seulement à son invention. »* — Mike Capone, PDG de Qlik
La beauté de DeepSeek réside dans sa capacité à aider et non pas seulement à impressionner. Comme le dit Mike Capone , PDG de Qlik : « La course à l’IA ne se gagnera pas en créant le modèle le plus sophistiqué, mais en intégrant l’IA dans les systèmes d’entreprise pour générer une valeur économique tangible. Le leadership mondial en matière d’IA doit se mesurer à son application, et pas seulement à son invention. »
Et l'histoire de gloire continue. DeepSeek vient d'annoncer Janus Pro , un modèle d'image IA qui rivalise avec DALL·E 3 d'OpenAI. Si, ou peut-être devrions-nous dire, quand DeepSeek se lance dans la génération de vidéos, des concurrents comme Veo de Google et Sora d'OpenAI pourraient être en difficulté ensuite.
Entre-temps, Alibaba a publié son modèle d'IA Qwen 2.5 qui, selon lui, surpasse DeepSeek . La pression ne pèse pas uniquement sur les grandes entreprises technologiques ou sur les États-Unis, mais également sur les petits acteurs et sur des pays comme l'Inde.
Navanwita Bora Sachdev , rédactrice en chef, The Tech Panda