Olá a todos!
Se a IA é uma corrida do ouro, a Nvidia é a melhor empresa de picaretas e pás. Todas as coisas relacionadas à IA passam pela Nvidia devido ao seu domínio como a única empresa que cria os chips (GPUs) necessários para implantar os grandes modelos de linguagem computacionalmente caros. À medida que os modelos aumentam, aumenta a necessidade de GPUs mais poderosas e o mundo inteiro depende da Nvidia para fornecê-las. Não é exagero dizer que a Nvidia está no centro de todas as coisas relacionadas à IA e recentemente eles tiveram sua conferência semestral de desenvolvedores GTC (18 a 21 de março). Neste post vou resumir minhas principais conclusões desta conferência muito especial do GTC e o que isso significa para o espaço da geração AI.
O poder daquilo que a IA genérica pode fazer e fornecer não se perdeu nos setores não tecnológicos. As empresas de todos os setores da economia consideram que é necessário adotarem a IA e encontrarem uma forma de estabelecer parcerias, executar e permanecer à frente. A prova aqui é quantas empresas do setor não tecnológico fizeram parceria com a Nvidia. Empresas do varejo, automobilística, construção, design e tudo mais anunciaram parcerias com a Nvidia.
Desde que os transformadores foram inventados, estamos duplicando a escala dos LLMs a cada 6 meses. Por exemplo, observe a contagem de parâmetros dos modelos Open AI abaixo.
Somente na série GPT-3 a contagem de parâmetros variou de 125M a 175B. E há rumores de que os modelos mais recentes que deverão sair da IA aberta têm contagens de parâmetros acima de trilhões e em breve poderão atingir trilhões em menos de dois anos, se a taxa de escalonamento continuar. Para apoiar a escala crescente de LLMs, precisamos de maior poder computacional. Para conquistar o mercado, a Nvidia está lançando uma nova série de GPUs chamada Blackwell, em homenagem ao estatístico e matemático David Blackwell. Blackwell é uma nova série de GPUs (GB200), mas também uma nova plataforma de supercomputador.
Aqui está uma comparação de desempenho da nova GPU Blackwell com sua GPU Hopper da geração anterior.
Na geração atual da computação, tudo se resume a recuperar um dado armazenado em diferentes formatos e apresentá-lo de uma forma que seja útil ao usuário. Mas na próxima geração de computação e aplicativos, estamos prestes a ver mais coisas sendo geradas a pedido do usuário e devolvidas ao usuário. No caso do chat-gpt por exemplo, a resposta que você está obtendo não é armazenada previamente em algum banco de dados, mas está sendo gerada em tempo real para atender a pergunta do usuário. Estamos prestes a ver a geração de textos, imagens, vídeos, produtos químicos, proteínas e muito mais.
Inferência é quando você faz uma pergunta ao chat-gpt, o modelo descobre a resposta na forma de geração de token e retorna a resposta na forma de tokens. Se a inferência não for rápida o suficiente, os consumidores não poderão usar nenhuma das aplicações de IA. A inferência é especialmente complicada porque os LLMs estão ficando cada vez maiores e não cabem em uma GPU, portanto, paralelizar a inferência entre GPUs é uma tarefa difícil e envolve programar GPUs Nvidia para usar múltiplas técnicas de otimização. Com as GPUs Blackwell, a Nvidia é capaz de atingir velocidades de inferência 30x mais rápidas.
À medida que aprendo mais e mais sobre o Omniverse da Nvidia, fico cada vez mais otimista em relação ao produto e à ideia. Isso ocorre porque, para realmente aproveitar a IA e desbloquear todas as possibilidades em automação e robótica, na verdade não temos todos os dados necessários. Por exemplo, digamos que você queira criar um robô que cozinhe comida excelente de todos os tipos. Não há dados onde você tenha uma visão em primeira pessoa de chefs cozinhando vários tipos de pratos. Temos dados gerais de vários tipos de culinária na forma de vídeos do YouTube, mas para que os robôs aprendam os movimentos físicos envolvidos na culinária são necessários dados em primeira pessoa. Uma simulação 3D do mundo no Omniverse pode ajudar a preencher a lacuna de dados necessária para desbloquear todos esses casos de uso. Estou extremamente otimista com a ideia.
É isso no dia 22 de 100 dias de IA.
Escrevo um boletim informativo chamado Above Average, onde falo sobre os insights de segunda ordem por trás de tudo o que está acontecendo nas grandes tecnologias. Se você trabalha com tecnologia e não quer ser mediano, inscreva-se .
Siga-me no Twitter , LinkedIn ou HackerNoon para obter as atualizações mais recentes sobre 100 dias de IA ou adicione esta página aos favoritos . Se você trabalha com tecnologia, pode estar interessado em ingressar na minha comunidade de profissionais de tecnologia aqui .