100 días de IA, día 16: 5 conclusiones clave del evento para desarrolladores de IA de NVIDIA

¡Hola a todos! soy nataraj Y , al igual que usted, me han fascinado los recientes avances de la inteligencia artificial. Al darme cuenta de que necesitaba estar al tanto de todos los avances que ocurrían, decidí embarcarme en un viaje personal de aprendizaje, así 100 días de IA ¡nació! Con esta serie, aprenderé sobre los LLM y compartiré ideas, experimentos, opiniones, tendencias y aprendizajes a través de las publicaciones de mi blog. Puedes seguir el viaje en HackerNoon aquí o mi sitio web personal aquí . En el artículo de hoy, hablaremos sobre las conclusiones de Nvidia.

Si la IA es una fiebre del oro, Nvidia es la mejor empresa de selecciones y palas. Todo lo relacionado con la IA pasa por Nvidia debido a su dominio como única empresa que crea los chips (GPU) necesarios para implementar los grandes modelos de lenguaje computacionalmente costosos. A medida que los modelos crecen, aumenta la necesidad de GPU más potentes y el mundo entero confía en Nvidia para ofrecerlas. No es exagerado decir que Nvidia es el núcleo de todo lo relacionado con la IA y recientemente tuvieron su conferencia semestral de desarrolladores GTC (del 18 al 21 de marzo). En esta publicación, voy a resumir mis conclusiones clave de esta conferencia GTC tan especial y lo que significa para el espacio de la IA generacional.

Conclusión 1: la IA no se limita al sector tecnológico

El poder de lo que la IA de generación puede hacer y ofrecer no ha pasado desapercibido para los sectores no tecnológicos. Las empresas de todos los sectores de la economía creen que es necesario adoptar la IA y encontrar una manera de asociarse, ejecutar y mantenerse a la vanguardia. La prueba aquí es observar cuántas empresas del sector no tecnológico se han asociado con Nvidia. Empresas del comercio minorista, del automóvil, de la construcción, del diseño y de todo lo demás han anunciado asociaciones con Nvidia.

Conclusión 2: Necesitamos GPU mucho más grandes

Desde que se inventaron los transformadores, estamos duplicando la escala de LLM cada 6 meses. Por ejemplo, observe el recuento de parámetros de los modelos Open AI a continuación.

Solo en la serie GPT-3, el recuento de parámetros osciló entre 125M y 175B. Y se rumorea que los últimos modelos que se espera que surjan de Open AI tengan recuentos de parámetros superiores a billones y pronto podrían alcanzar billones en menos de dos años, si el ritmo de escalamiento continúa. Para respaldar la escala cada vez mayor de los LLM, necesitamos una mayor potencia computacional. Para capturar el mercado, Nvidia está lanzando una nueva serie de GPU llamada Blackwell, que lleva el nombre del estadístico y matemático David Blackwell. Blackwell es una nueva serie de GPU (GB200), pero también una nueva plataforma de súper computadora.

Aquí hay una comparación de rendimiento de la nueva GPU Blackwell con su GPU Hopper de la generación anterior.

Conclusión 3: Pasar de la recuperación a la generación

En la generación actual de informática, todo se trata de recuperar un dato almacenado en diferentes formatos y presentarlo de una manera que sea útil para el usuario. Pero en la próxima generación de informática y aplicaciones, estamos a punto de ver más cosas que se generan a petición del usuario y se las devuelven. En el caso de chat-gpt, por ejemplo, la respuesta que obtiene no se almacena en alguna base de datos de antemano, sino que se genera en tiempo real para atender la pregunta del usuario. Estamos a punto de ver la generación de texto, imágenes, videos, productos químicos, proteínas y más.

Conclusión 4: la inferencia está mejorando

La inferencia es cuando le haces una pregunta a chat-gpt, el modelo descubre la respuesta en forma de generación de tokens y devuelve la respuesta en forma de tokens. Si la inferencia no es lo suficientemente rápida, los consumidores no podrán utilizar ninguna de las aplicaciones de IA. La inferencia es especialmente complicada porque los LLM son cada vez más grandes y no caben en una GPU, por lo que paralelizar la inferencia entre GPU es una tarea difícil e implica programar las GPU de Nvidia para utilizar múltiples técnicas de optimización. Con las GPU Blackwell, Nvidia puede alcanzar velocidades de inferencia 30 veces más rápidas.

Conclusión 5: el verdadero metaverso es el Omniverso de NVidia

A medida que aprendí más y más sobre Omniverse de Nvidia, soy cada vez más optimista sobre el producto y la idea. Esto se debe a que, para aprovechar realmente la IA y desbloquear todas las posibilidades de la automatización y la robótica, en realidad no tenemos todos los datos necesarios. Por ejemplo, supongamos que desea crear un robot que cocine excelente comida de todo tipo. No hay datos que muestren en primera persona a los chefs cocinando diversos tipos de platos. Disponemos de datos generales de diversas cocinas en forma de vídeos de YouTube, pero para que los robots aprendan los movimientos físicos implicados en la cocina se necesitan datos en primera persona. Una simulación 3D del mundo en Omniverse puede ayudar a cerrar la brecha de datos necesarios para desbloquear todos estos casos de uso. Soy extremadamente optimista con la idea.

Eso es todo por el día 22 de 100 días de IA.

Escribo un boletín llamado Above Average donde hablo sobre los conocimientos de segundo orden detrás de todo lo que está sucediendo en la gran tecnología. Si estás en tecnología y no quieres ser promedio, suscríbete .

Sígueme en Twitter , LinkedIn o HackerNoon para obtener las últimas actualizaciones sobre 100 días de IA o agrega esta página a tus favoritos . Si está en tecnología, es posible que le interese unirse a mi comunidad de profesionales de la tecnología aquí .

100 días de IA, día 16: 5 conclusiones clave del evento para desarrolladores de IA de NVIDIA

Demasiado Largo; Para Leer

Conclusión 1: la IA no se limita al sector tecnológico

Conclusión 2: Necesitamos GPU mucho más grandes

Conclusión 3: Pasar de la recuperación a la generación

Conclusión 4: la inferencia está mejorando

Conclusión 5: el verdadero metaverso es el Omniverso de NVidia

About Author

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN...

Categories

Trending Topics

100 días de IA, día 16: 5 conclusiones clave del evento para desarrolladores de IA de NVIDIA

Demasiado Largo; Para Leer

Conclusión 1: la IA no se limita al sector tecnológico

Conclusión 2: Necesitamos GPU mucho más grandes

Conclusión 3: Pasar de la recuperación a la generación

Conclusión 4: la inferencia está mejorando

Conclusión 5: el verdadero metaverso es el Omniverso de NVidia

About Author

ETIQUETAS

ESTE ARTÍCULO FUE PRESENTADO EN...

HISTORIAS RELACIONADAS

Categories

Trending Topics