paint-brush
AI の 100 日間、16 日目: NVIDIA の aI 開発者イベントから得た 5 つの重要なポイント@sindamnataraj
444 測定値
444 測定値

AI の 100 日間、16 日目: NVIDIA の aI 開発者イベントから得た 5 つの重要なポイント

Nataraj4m2024/03/27
Read on Terminal Reader

長すぎる; 読むには

Nvidia は最近、半年に一度の開発者カンファレンス GTC (3 月 18 ~ 21 日) を開催しました。この記事では、イベントから得た意見をまとめていきます。
featured image - AI の 100 日間、16 日目: NVIDIA の aI 開発者イベントから得た 5 つの重要なポイント
Nataraj HackerNoon profile picture



こんにちは、みなさん! 私はナタラジですあなたと同じように、私も最近の人工知能の進歩に魅了されてきました。起こっているすべての発展を常に把握しておく必要があることに気づき、私は個人的な学習の旅に乗り出すことにしました。 AI の 100 日間うまれた!このシリーズでは、LLM について学び、ブログ投稿を通じてアイデア、実験、意見、傾向、学習内容を共有します。 HackerNoon でその旅をたどることができますここまたは私の個人的なウェブサイトここ。今日の記事では、Nvidia の利点について説明します。


AI がゴールドラッシュだとすれば、Nvidia は究極の掘り出し物企業です。 Nvidia は、計算コストのかかる大規模な言語モデルを展開するために必要なチップ (GPU) を作成する唯一の企業としての優位性があるため、AI はすべて Nvidia を介して処理されます。モデルがスケールするにつれて、より強力な GPU の必要性が高まり、世界中が Nvidia にそれらの提供を依存しています。 Nvidia はあらゆる AI の中核であると言っても過言ではありません。Nvidia は最近、半年に一度の開発者カンファレンス GTC (3 月 18 ~ 21 日) を開催しました。この投稿では、この非常に特別な GTC カンファレンスから得た重要なポイントと、それが世代 AI 分野にとって何を意味するかを要約します。

教訓 1: AI はテクノロジー分野に限定されない

次世代 AI が実行できること、実現できることの力は、非テクノロジー分野でも失われていません。経済のあらゆる分野の企業は、AI を導入し、提携し、実行し、先を行く方法を見つける必要があると考えています。ここでの証拠は、非テクノロジー部門の企業の数が Nvidia と提携しているかどうかを見ていることです。小売、自動車、建設、デザインなどあらゆる企業が Nvidia との提携を発表しました。



要点 2: はるかに大きな GPU が必要です

変圧器が発明されて以来、私たちは 6 か月ごとに LLM の規模を 2 倍に増やしています。たとえば、以下の Open AI モデルのパラメータ数を見てください。

GPT-3 シリーズだけでも、パラメータ数は 125M から 175B の範囲にありました。そして、Open AI から登場すると予想される最新モデルのパラメータ数は兆を超え、このままスケーリングが続けば、2 年以内に数兆に達する可能性があると噂されています。 LLM の規模の増大をサポートするには、計算能力の向上が必要です。市場を獲得するために、Nvidia は統計学者で数学者の David Blackwell にちなんで名付けられた Blackwell と呼ばれる新しい GPU シリーズを発売します。 Blackwell は新しいシリーズの GPU (GB200) ですが、新しいスーパー コンピューター プラットフォームでもあります。


以下は、新しい Blackwell GPU と前世代の GPU Hopper のパフォーマンスの比較です。



要点 3: 取得から生成への移行

現世代のコンピューティングでは、さまざまな形式で保存されたデータを取得し、それをユーザーにとって役立つ方法で表示することがすべてです。しかし、次の世代のコンピューティングとアプリでは、ユーザーのリクエストに応じて何かを生成し、それをユーザーに返すことがさらに増えようとしています。たとえば、chat-gpt の場合、得られる回答は事前にデータベースに保存されるのではなく、ユーザーの質問に応えるためにリアルタイムで生成されます。私たちは、テキスト、画像、ビデオ、化学物質、タンパク質などの生成を目の当たりにしようとしています。

教訓 4: 推論は改善されている

推論とは、chat-gpt に質問すると、モデルがトークン生成の形で答えを見つけ出し、トークンの形で答えを返すことです。推論が十分に高速でない場合、消費者は AI アプリケーションを使用できなくなります。 LLM はますます大きくなり、1 つの GPU に収まらなくなるため、推論は特に困難になります。そのため、GPU 全体で推論を並列化することは困難な作業であり、複数の最適化手法を使用するように Nvidia GPU をプログラミングする必要があります。 Blackwell GPU を使用することで、Nvidia は 30 倍の推論速度を達成できます。


教訓 5: 本当のメタバースは NVidia のオムニバースです

Nvidia の Omniverse について学ぶにつれて、私はその製品とアイデアに対してますます強気になりました。これは、AI を実際に活用し、自動化とロボティクスのあらゆる可能性を解き放つには、実際には必要なデータがすべて揃っているわけではないためです。たとえば、あらゆる種類のおいしい料理を調理するロボットを作成したいとします。シェフがさまざまな種類の料理を調理している様子を一人称視点で見ることができるデータはありません。さまざまな料理に関する一般的なデータは YouTube 動画の形式で用意されていますが、料理に伴う身体の動きをロボットに学習させるには、一人称視点のデータが必要です。 Omniverse での世界の 3D シミュレーションは、これらすべてのユースケースのロックを解除するために必要なデータのギャップを埋めるのに役立ちます。私はその考えに対して非常に強気です。


以上、100 日間の AI の 22 日目でした。


私は「Above Average」というニュースレターを執筆しており、大手テクノロジー業界で起こっているすべての背後にある二次的な洞察について話しています。テクノロジー業界にいて、平均的な人間になりたくない場合は、購読してください


AI の 100 日間に関する最新情報については、 TwitterLinkedIn 、またはHackerNoonで私をフォローするか、このページをブックマークしてください。テクノロジーに携わっている場合は、ここにあるテクノロジー専門家のコミュニティに参加することに興味があるかもしれません。