¡Hola a todos!
Si la IA es una fiebre del oro, Nvidia es la mejor empresa de selecciones y palas. Todo lo relacionado con la IA pasa por Nvidia debido a su dominio como única empresa que crea los chips (GPU) necesarios para implementar los grandes modelos de lenguaje computacionalmente costosos. A medida que los modelos crecen, aumenta la necesidad de GPU más potentes y el mundo entero confía en Nvidia para ofrecerlas. No es exagerado decir que Nvidia es el núcleo de todo lo relacionado con la IA y recientemente tuvieron su conferencia semestral de desarrolladores GTC (del 18 al 21 de marzo). En esta publicación, voy a resumir mis conclusiones clave de esta conferencia GTC tan especial y lo que significa para el espacio de la IA generacional.
El poder de lo que la IA de generación puede hacer y ofrecer no ha pasado desapercibido para los sectores no tecnológicos. Las empresas de todos los sectores de la economía creen que es necesario adoptar la IA y encontrar una manera de asociarse, ejecutar y mantenerse a la vanguardia. La prueba aquí es observar cuántas empresas del sector no tecnológico se han asociado con Nvidia. Empresas del comercio minorista, del automóvil, de la construcción, del diseño y de todo lo demás han anunciado asociaciones con Nvidia.
Desde que se inventaron los transformadores, estamos duplicando la escala de LLM cada 6 meses. Por ejemplo, observe el recuento de parámetros de los modelos Open AI a continuación.
Solo en la serie GPT-3, el recuento de parámetros osciló entre 125M y 175B. Y se rumorea que los últimos modelos que se espera que surjan de Open AI tengan recuentos de parámetros superiores a billones y pronto podrían alcanzar billones en menos de dos años, si el ritmo de escalamiento continúa. Para respaldar la escala cada vez mayor de los LLM, necesitamos una mayor potencia computacional. Para capturar el mercado, Nvidia está lanzando una nueva serie de GPU llamada Blackwell, que lleva el nombre del estadístico y matemático David Blackwell. Blackwell es una nueva serie de GPU (GB200), pero también una nueva plataforma de súper computadora.
Aquí hay una comparación de rendimiento de la nueva GPU Blackwell con su GPU Hopper de la generación anterior.
En la generación actual de informática, todo se trata de recuperar un dato almacenado en diferentes formatos y presentarlo de una manera que sea útil para el usuario. Pero en la próxima generación de informática y aplicaciones, estamos a punto de ver más cosas que se generan a petición del usuario y se las devuelven. En el caso de chat-gpt, por ejemplo, la respuesta que obtiene no se almacena en alguna base de datos de antemano, sino que se genera en tiempo real para atender la pregunta del usuario. Estamos a punto de ver la generación de texto, imágenes, videos, productos químicos, proteínas y más.
La inferencia es cuando le haces una pregunta a chat-gpt, el modelo descubre la respuesta en forma de generación de tokens y devuelve la respuesta en forma de tokens. Si la inferencia no es lo suficientemente rápida, los consumidores no podrán utilizar ninguna de las aplicaciones de IA. La inferencia es especialmente complicada porque los LLM son cada vez más grandes y no caben en una GPU, por lo que paralelizar la inferencia entre GPU es una tarea difícil e implica programar las GPU de Nvidia para utilizar múltiples técnicas de optimización. Con las GPU Blackwell, Nvidia puede alcanzar velocidades de inferencia 30 veces más rápidas.
A medida que aprendí más y más sobre Omniverse de Nvidia, soy cada vez más optimista sobre el producto y la idea. Esto se debe a que, para aprovechar realmente la IA y desbloquear todas las posibilidades de la automatización y la robótica, en realidad no tenemos todos los datos necesarios. Por ejemplo, supongamos que desea crear un robot que cocine excelente comida de todo tipo. No hay datos que muestren en primera persona a los chefs cocinando diversos tipos de platos. Disponemos de datos generales de diversas cocinas en forma de vídeos de YouTube, pero para que los robots aprendan los movimientos físicos implicados en la cocina se necesitan datos en primera persona. Una simulación 3D del mundo en Omniverse puede ayudar a cerrar la brecha de datos necesarios para desbloquear todos estos casos de uso. Soy extremadamente optimista con la idea.
Eso es todo por el día 22 de 100 días de IA.
Escribo un boletín llamado Above Average donde hablo sobre los conocimientos de segundo orden detrás de todo lo que está sucediendo en la gran tecnología. Si estás en tecnología y no quieres ser promedio, suscríbete .
Sígueme en Twitter , LinkedIn o HackerNoon para obtener las últimas actualizaciones sobre 100 días de IA o agrega esta página a tus favoritos . Si está en tecnología, es posible que le interese unirse a mi comunidad de profesionales de la tecnología aquí .