Всем привет!
Если искусственный интеллект — это золотая лихорадка, то Nvidia — лучшая компания, занимающаяся кирками и лопатами. Все, что касается ИИ, проходит через Nvidia из-за ее доминирования как единственной компании, создающей чипы (графические процессоры), необходимые для развертывания дорогостоящих в вычислительном отношении моделей большого языка. По мере масштабирования моделей увеличивается потребность в более мощных графических процессорах, и весь мир полагается на Nvidia в их обеспечении. Не будет преувеличением сказать, что Nvidia лежит в основе всего, что касается искусственного интеллекта, и недавно они провели полугодовую конференцию разработчиков GTC (18-21 марта). В этом посте я собираюсь подвести итог своим ключевым выводам из этой особенной конференции GTC и рассказать, что она значит для сферы искусственного интеллекта.
Сила того, что может сделать и обеспечить поколение ИИ, не была потеряна в нетехнологических секторах. Компании во всех секторах экономики считают, что им необходимо внедрить ИИ и найти способ сотрудничать, работать и оставаться впереди. Доказательством тому является количество компаний нетехнологического сектора, сотрудничающих с Nvidia. Компании из сферы розничной торговли, автомобилестроения, строительства, дизайна и всего остального объявили о партнерстве с Nvidia.
С тех пор, как были изобретены трансформаторы, мы удваиваем масштаб LLM каждые 6 месяцев. Например, посмотрите на количество параметров моделей Open AI ниже.
Только в серии GPT-3 количество параметров варьировалось от 125M до 175B. А последние модели, которые, как ожидается, выйдут из Open AI, по слухам, будут иметь число параметров, превышающее триллион, и вскоре их число может достичь триллионов менее чем за два года, если темпы масштабирования сохранятся. Для поддержки растущего масштаба LLM нам нужна увеличенная вычислительная мощность. Чтобы захватить рынок, Nvidia запускает новую серию графических процессоров под названием Blackwell, названную в честь статистика и математика Дэвида Блэквелла. Blackwell — это новая серия графических процессоров (GB200), а также новая суперкомпьютерная платформа.
Вот сравнение производительности нового графического процессора Blackwell с графическим процессором Hopper предыдущего поколения.
В современном поколении вычислений все сводится к извлечению части данных, хранящихся в различных форматах, и представлению их в удобном для пользователя виде. Но в грядущем поколении компьютеров и приложений мы увидим больше создания вещей по запросу пользователя и возврата их пользователю. Например, в случае с Chat-GPT ответ, который вы получаете, не сохраняется в какой-либо базе данных заранее, а генерируется в реальном времени для обслуживания вопроса пользователя. Мы вот-вот увидим генерацию текста, изображений, видео, химических веществ, белков и многого другого.
Вывод — это когда вы задаете вопрос в чат-gpt, модель определяет ответ в форме генерации токенов и возвращает ответ в виде токенов. Если вывод не будет достаточно быстрым, потребители не смогут использовать ни одно из приложений ИИ. Вывод особенно сложен, поскольку LLM становятся все больше и больше и не помещаются в один графический процессор, поэтому распараллеливание вывода между графическими процессорами является сложной задачей и требует программирования графических процессоров Nvidia для использования нескольких методов оптимизации. Благодаря графическим процессорам Blackwell Nvidia может добиться в 30 раз большей скорости вывода.
По мере того, как я узнавал все больше и больше об Omniverse от Nvidia, я все больше и больше оптимистично отношусь к этому продукту и идее. Это связано с тем, что для того, чтобы по-настоящему использовать ИИ и раскрыть все возможности автоматизации и робототехники, у нас фактически нет всех необходимых данных. Например, предположим, что вы хотите создать робота, который готовит вкусную еду всех видов. Нет данных, где бы вы могли увидеть от первого лица поваров, готовящих различные блюда. У нас есть общие данные о различных приготовлениях пищи в виде видеороликов на YouTube, но чтобы роботы научились физическим движениям, связанным с приготовлением пищи, необходимы данные от первого лица. Трехмерная симуляция мира в Omniverse может помочь заполнить пробел в данных, необходимых для раскрытия всех этих вариантов использования. Я очень оптимистично отношусь к этой идее.
Вот и все, 22-й день из 100 дней ИИ.
Я пишу информационный бюллетень под названием «Выше среднего», в котором рассказываю об идеях второго порядка, стоящих за всем, что происходит в больших технологиях. Если вы разбираетесь в технологиях и не хотите быть средним, подпишитесь на него .
Следуйте за мной в Twitter , LinkedIn или HackerNoon, чтобы получать последние новости о 100 днях ИИ, или добавьте эту страницу в закладки . Если вы работаете в сфере технологий, возможно, вам будет интересно присоединиться к моему сообществу технических специалистов здесь .