215 lecturas

DeepSeek AI: el modelo de inteligencia artificial respaldado por fondos de cobertura que hace sudar a las grandes tecnológicas

por The Tech Panda6m2025/02/24

Demasiado Largo; Para Leer

El modelo de razonamiento DeepSeek-R1 de China, con licencia del MIT y totalmente de código abierto, es un fuerte contendiente para el modelo o1 de OpenAI, un fuerte rival para Google y Meta. El anuncio pone de relieve la importancia de la innovación y de centrarse en las aplicaciones.

featured image - DeepSeek AI: el modelo de inteligencia artificial respaldado por fondos de cobertura que hace sudar a las grandes tecnológicas

El lanzamiento de DeepSeek-R1 por parte de China, un modelo de razonamiento totalmente de código abierto con licencia del MIT y fuerte competidor del o1 de OpenAI , ha generado revuelo en los medios y en las salas de juntas en lo que se ha llamado una historia de David y Goliat.

La inteligencia artificial se ha convertido en el nuevo campo de batalla de las potencias globales para demostrar su dominio. Días después de que Trump anunciara que invertiría 500.000 millones de dólares en construir infraestructura de inteligencia artificial en todo Estados Unidos que generaría más de 100.000 puestos de trabajo, la startup china DeepSeek lanzó R1, desafiando el modelo de OpenAI.

Y a los desarrolladores les encanta . A diferencia del ecosistema cerrado de OpenAI, uno puede modificar DeepSeek-R1 según sus propias necesidades, ya sea para fines comerciales o de investigación.

*“Vivimos en una época en la que una empresa no estadounidense mantiene viva la misión original de OpenAI: una investigación verdaderamente abierta y de vanguardia que empodera a todos”,* — Jim Fan, gerente sénior de investigación y líder de IA incorporada (GEAR Lab) en NVIDIA

“Vivimos en una época en la que una empresa no estadounidense mantiene viva la misión original de OpenAI : una investigación verdaderamente abierta y de vanguardia que empodera a todos”, dijo a AIM Jim Fan , gerente sénior de investigación y líder de IA incorporada (GEAR Lab) en NVIDIA.

“Nuestro objetivo es explorar el potencial de los LLM para desarrollar capacidades de razonamiento sin ningún dato supervisado, centrándonos en su autoevolución a través de un proceso de RL puro”, citó AIM al equipo de DeepSeek.

La comunidad de IA ciertamente está prestando atención y tomando nota.

*“Esto realmente democratiza la IA y ofrece a los países que no cuentan con la infraestructura existente un gran paso adelante para experimentar y ser parte de la frontera”. * — Bruce Keith, cofundador y director ejecutivo de InvestorAi

Bruce Keith, cofundador y director ejecutivo de InvestorAi , afirma: “DeepSeek R1 ha desafiado definitivamente el dominio de unos pocos actores en el ecosistema de modelos y datos; OpenAI, Google y Meta serán los más afectados. R1 tendrá un impacto significativo en el panorama de la IA. El anuncio pone de relieve la importancia de la innovación y de centrarse en las aplicaciones y los datos en lugar de solo en la capacidad de procesamiento. Esto realmente democratiza la IA y ofrece a los países que no cuentan con la infraestructura existente un gran paso adelante para experimentar y ser parte de la frontera”.

En cuestión de días, el modelo de IA creado en China ha revolucionado la industria, superando a o1 de OpenAI y destronando a ChatGPT en la App Store , mientras que la capitalización de mercado de NVIDIA se desplomó en 589 mil millones de dólares . A diferencia del ecosistema cerrado de OpenAI, DeepSeek-R1 es de código abierto, de uso gratuito y radicalmente eficiente. Logra un rendimiento de vanguardia sin requerir clústeres de GPU masivos, lo que obliga a la industria a repensar la carrera armamentista de alto costo en IA.

Donald Trump ya lo calificó de “llamada de atención” para las empresas estadounidenses de inteligencia artificial.

Es barato

La startup china de inteligencia artificial ha causado conmoción en Silicon Valley, poniendo en tela de juicio el dominio de las grandes tecnológicas estadounidenses en el mercado de la inteligencia artificial. DeepSeek, que se basa íntegramente en tecnología de código abierto y chips de gama baja, evita la necesidad de hardware de alta gama restringido por los controles de exportación estadounidenses y afirma haber desarrollado el modelo por tan solo 5,6 millones de dólares . Como resultado, DeepSeek está disponible a un coste que es solo el 2% de lo que los usuarios gastarían en el modelo O1 de OpenAI.

*“DeepSeek no es el primer modelo de código abierto, pero su licencia MIT y su modelo de pensamiento R1 destacan por su precisión y bajo costo de entrenamiento, democratizando el acceso a la IA avanzada, ya sea de manera local o a través de API accesibles, impulsando así la innovación”. * — Christian Struve, cofundador y CEO de Fracttal

“DeepSeek no es el primer modelo de código abierto, pero su licencia MIT y su modelo de pensamiento R1 destacan por su precisión y bajo coste de entrenamiento, democratizando el acceso a la IA avanzada, ya sea de forma local o a través de APIs accesibles, impulsando así la innovación”.

Christian Struve , cofundador y director ejecutivo de Fracttal .

*“DeepSeek se posicionó muy fácilmente al mismo nivel que Meta como un buen competidor de los grandes en el modelo “ganador” (prevalente) en el mundo de las aplicaciones impulsadas por IA”. * — JD Raimondi, director de ciencia de datos en Making Sense

“DeepSeek tomó la iniciativa que Meta había tomado internamente: competir con los grandes modelos privados con modelos públicos que pueden ser utilizados por todos a bajo costo. Pero el diferenciador de DeepSeek con r1 es nuevo: además de ser gratuito, es eficiente, de bajo costo y con un rendimiento comparable al de los grandes (GPT o1, GPT o4). DeepSeek se posicionó muy fácilmente al mismo nivel que Meta como un buen competidor de los grandes para el modelo “ganador” (prevalente) en el mundo de las aplicaciones impulsadas por IA”, dice JD Raimondi, director de ciencia de datos en Making Sense .

El hecho de que hayan creado esta plataforma con inversiones de menos de 6 millones de dólares ha sacudido a los CEOs de tecnología a nivel mundial, destacando que las innovaciones que cambian el juego no necesariamente necesitan inversiones de miles de millones de dólares.

“Sin embargo, desde una perspectiva de oferta y demanda, el mercado de GPU que domina Nvidia aún está lejos de alcanzar la demanda máxima”, añade Bruce Keith.

¿Es este el momento TikTok de la IA?

Pero DeepSeek no está exento de controversias. La aplicación está planteando cuestiones como la privacidad de los datos, la seguridad nacional y las implicaciones geopolíticas. La política de privacidad de DeepSeek confirma que los datos de los usuarios se almacenan en China. El ex ministro de TI indio Rajeev Chandrasekhar, uno de los políticos indios expertos en tecnología, ya se ha preguntado si DeepSeek es el TikTok de la IA.

“…es crucial analizar en detalle sus oportunidades y desafíos, así como su potencial real para impulsar la transformación digital de nuestros clientes.” — Harold Barber, COO y CFO de Escala 24×7

“DeepSeek está revolucionando el mercado de la IA con una propuesta innovadora que desafía a los principales actores del área y podría transformar radicalmente la forma en que las empresas acceden y utilizan esta tecnología. Sin embargo, es crucial analizar en detalle sus oportunidades y desafíos, así como su potencial real para impulsar la transformación digital de nuestros clientes”, advierte Harold Barber , COO y CFO de Escala 24×7 .

La Marina de Estados Unidos ya ha prohibido DeepSeek .

Aun así, aunque es de código abierto, la versión china de la IA funciona con una estricta censura y no responde a preguntas políticamente sensibles. Al mismo tiempo, su naturaleza de código abierto permite a los desarrolladores ejecutarla localmente, sin restricciones , un punto formidable a su favor.

Una historia de inteligencia artificial entre David y Goliat

Paramdeep Singh, cofundador de Shorthills AI , dice que DeepSeek cambia completamente la narrativa de GenAI.

“Es como si David hubiera derrotado a Goliat. La vieja historia de GenAI era que solo los modelos grandes podían ganar. Se requerían habilidades superespecializadas, una enorme capacidad de procesamiento, miles de GPU de última generación, datos a escala web, billones de nodos y una enorme cantidad de electricidad para entrenar un modelo de lenguaje fundamental. Todo esto se tradujo en millones de dólares para entrenar el modelo. Eso significaba que las empresas y los países con mucho dinero iban a monopolizar ese mercado.

“Es como si David hubiera vencido a Goliat. La vieja historia de GenAI era que solo los grandes modelos podían ganar... Ahora tenemos a Deepseek, que ha cambiado por completo esta historia. Tenemos un gestor de fondos de cobertura que ha lanzado un modelo que supera a los grandes modelos de GenAI en todos los parámetros”, — Paramdeep Singh, cofundador de Shorthills AI

“Ahora tenemos a Deepseek, que ha cambiado por completo esta historia. Tenemos un gestor de fondos de cobertura que ha lanzado un modelo que supera a los grandes de GenAI en todos los parámetros. El modelo es frugal y se entrena con capacidad de reserva de GPU que estaban inactivas. El modelo es tan pequeño que literalmente puede ejecutarse en su navegador. Es simplemente el modelo con la mejor relación calidad-precio. Tenemos un rayo de esperanza en el que el entrenamiento y el uso de modelos de lenguaje de gran tamaño pueden democratizarse. No se trata de personas sentadas en torres de marfil, sino de talento con hardware frugal que puede entrenar el mejor modelo. A todos nos encanta esta historia de David contra Goliat”, afirma.

*“La carrera de la IA no se ganará creando el modelo más sofisticado, sino incorporando la IA a los sistemas empresariales para generar un valor económico tangible. El liderazgo mundial en IA debería medirse por su aplicación, no solo por su invención”. * — Mike Capone, director ejecutivo de Qlik

La belleza de DeepSeek reside en su capacidad de ayudar y no solo de sorprender. Como dice Mike Capone , director ejecutivo de Qlik : “La carrera de la IA no se ganará creando el modelo más sofisticado; se ganará incorporando la IA a los sistemas empresariales para generar un valor económico tangible. El liderazgo mundial en IA debería medirse por su aplicación, no solo por su invención”.

Y la historia de gloria continúa. DeepSeek acaba de anunciar Janus Pro , un modelo de imagen de IA que rivaliza con DALL·E 3 de OpenAI. Si (o tal vez deberíamos decir, cuando) DeepSeek se meta en la generación de video, competidores como Veo de Google y Sora de OpenAI podrían estar en problemas.

Mientras tanto, Alibaba lanzó su modelo de inteligencia artificial Qwen 2.5, que según afirma supera a DeepSeek . La presión no solo recae sobre las grandes empresas tecnológicas o solo sobre Estados Unidos, sino también sobre actores más pequeños y países como India.