人工知能に対する熱い見方がいたるところにあります。どこに目を向けるかによって、生成型 AI は私たちを殺すか、私たちの仕事を奪い、単調な仕事から私たちを解放するか、あるいは途方もないイノベーションを引き起こすかのいずれかになります。 (いずれにせよ、規制を求める声はここにあります。) The Markup では、実際の結果の測定を含む、慎重なアプローチを取ることを好みます。
そこで、カリフォルニア大学リバーサイド校のコンピュータ サイエンス准教授、シャオレイ レン氏とこの Q&A を共有できることをうれしく思います。候補者のPengfei Li氏とJianyi Yang氏、そしてテキサス大学アーリントン校のコンピュータサイエンス准教授であるMohammad A. Islam氏は、最近AIの秘密の水のフットプリントを定量化した論文を発表した。
新興テクノロジーの二酸化炭素排出量が注目を集めていますが、真に持続可能性を目指して構築するには、水も方程式に含める必要があります。
また、こんにちは!私は The Markup の CEO、Nabiha Syed です。私はたまたま、それを優先すれば、テクノロジーの進歩は健全な地球と共存できると信じている人間です。読み続けて、ChatGPT の 1 回の会話でどれだけの水を「飲む」可能性があるか、そして AI による水の使用量を削減するために実行できる具体的な手順を学びましょう。
(この Q&A は、簡潔さと明確さのために編集されています。)
Syed: 非常に正当な理由がありますが、GPT‑3 や GPT‑4 などの AI モデルやビットコイン マイニングなど、さまざまなテクノロジーの二酸化炭素排出量がさらに精査され始めています。しかし、あなたの研究は、あまり注目されていないもの、つまり AI テクノロジーの秘密の水の跡に焦点を当てています。調査結果について教えてください。
レン:水のフットプリントは、淡水は「無限」の資源であるという大きな誤解や、水の価格が比較的低いことなど、さまざまな理由から目立たないままになっています。 AI モデル開発者の多くは、水の使用量さえ認識していません。しかし、これは、特にカリフォルニアのような干ばつ地域では、水のフットプリントが重要ではないという意味ではありません。
私は学生たちとアーリントン工科大学の共同研究者と一緒に、最先端の推定手法を使用して AI の水のフットプリントに関する研究を行いました。大規模な AI モデルは実際に水を大量に消費していることがわかりました。
たとえば、Microsoft の最先端の米国データ センターで GPT-3 をトレーニングすると、700,000 リットルのきれいな淡水 (BMW 車 370 台またはテスラ電気自動車 320 台を生産するのに十分な量) が直接消費されます。トレーニングはアジアにあるマイクロソフトのデータセンターで行われました。これらの数値には、発電に伴う敷地外の水の使用量は含まれていません。
推論 (つまり、ChatGPT との会話) の場合、モデルがデプロイされる時期と場所に応じて、ChatGPT は約 20 ~ 50 の質問と回答の短い会話に 500 ml の水のボトルが必要であることが推定されています。 ChatGPT の巨大なユーザー ベースを考慮すると、推論のための総ウォーター フットプリントは膨大になる可能性があります。
次に、AI モデルの実行時の水効率の独特の時空間的多様性、つまり水効率は時間の経過と場所によって変化することをさらに研究しました。これは、特定の時間および特定の場所で AI のワークロードとタスクを動的にスケジュールすることで、AI による水の使用量を削減できる可能性があることを意味します。これは、夜間の安い電気料金を利用して電気自動車を充電することで電気代を削減する方法と同じです。
サイード: この水のフットプリントを、たとえば牛肉などと比較するとどうでしょうか?
レン:いくつかのウェブサイトを見ると、牛肉やジーンズには大きな水の使用量があることがわかりますが、それらの水の使用量はライフサイクル全体であり、非飲料水の大部分が含まれています。たとえば、ジーンズの水の使用量は綿の成長から始まります。
私たちの研究では、運用上の水のフットプリント(つまり、AI モデルのトレーニングと実行に関連する水の消費量)のみを考慮し、具体化された水のフットプリント(たとえば、チップ製造を含む AI サーバーの製造および輸送に関連する水のフットプリント)は除外します。 AI モデルの具体化されたウォーター フットプリントを考慮に入れると、全体的なウォーター フットプリントは簡単に 10 倍、あるいはそれ以上に増加するだろうというのが私の直感です。
サイード: 私は特に、二酸化炭素削減と水の保全がどのように相互に緊張関係にあるのかについて興味があります。 「太陽を追うべきか、太陽を追わないべきか」と尋ねるとき、あなたは何を意味しますか?
Ren:水の効率は主に外気温と発電用のエネルギー燃料混合に依存します。炭素効率の良い時間や場所は水の効率の良い時間や場所を意味するわけではなく、場合によってはそれらが逆になることさえあります。
水を重視するユーザーは、水の効率が良い時間帯や水の効率の良いデータセンターで AI モデルの推論サービスを使用することを好むかもしれません。
たとえば、カリフォルニアでは正午頃に太陽エネルギーの生産量が多くなり、炭素効率が最も高くなる時間帯になりますが、正午頃には外気温も高くなるため、水の効率が最も悪くなります。その結果、二酸化炭素排出量の削減のみを考慮すると (たとえば、正午頃に AI トレーニングをより多くスケジュールするなど)、水の消費量が増加する可能性が高く、これは AI にとって真に持続可能なものではありません。
一方で、水の排出量を削減するだけの場合(たとえば、深夜に AI トレーニングをスケジュールするなど)、利用可能な太陽エネルギーが減少するため、二酸化炭素排出量が増加する可能性があります。
サイード: Microsoft、Google、Amazon などのテクノロジー大手が AI の将来に大きく賭けていることは明らかですが、開発において環境への配慮を優先しているのは目に見えていますか?
Ren:はい、 Google 、 Microsoft 、 Metaなどのいくつかのテクノロジー大手の持続可能性報告書の中で、ウォーターフットプリントが優先事項として浮上しているのを私たちは見てきました。
また、議員らは最近、データセンターの水使用量が地域環境に及ぼす影響について検討し始めています。たとえば、ラウドン郡が「世界のデータセンター首都」として知られるバージニア州では、今年初めに提案されたSB 1078では、「データセンターが水の使用量と炭素に及ぼす影響を調査するための敷地評価」が必要となります。排出量だけでなく農業資源への影響も考慮する必要があります。」
これまでの業界の取り組みのほとんどは、データセンターの冷却塔の効率を改善したり、地元の飲料水資源を利用する代わりにリサイクル水を処理したりするなど、「エンジニアリング」の観点からオンサイトの水効率を改善することに焦点を当ててきました。それにもかかわらず、大多数のデータセンターは依然として飲料水と冷却塔を使用しています。
たとえば、Google のような巨大テクノロジー企業でさえ冷却塔に大きく依存しており、毎年数十億リットルの飲料水を消費しています。
このような膨大な水の消費により、地域の水インフラにストレスが生じています。 Google のデータ センターは、オレゴン州ザ ダレスにある水の 4 分の 1 以上を使用しており、さらに多くのデータ センターはカリフォルニアなどの干ばつが発生しやすい地域にもあります。
私たちの研究は、大規模な AI モデルを「いつ」「どこで」トレーニングするかによって、ウォーター フットプリントに大きな影響を与える可能性があることを示しています。
根本的な理由は、オンサイトとオフサイトの水利用効率 (WUE) の時空間的多様性です。オンサイトの WUE は外部の気象条件の変化によって変化し、オフサイトの WUE は送電網の変化によって変化します。時間とともに変化する需要を満たすためのエネルギー燃料混合物。実際、WUE は月ごとや季節ごとよりもはるかに速いタイムスケールで変化します。
したがって、WUE の時空間的多様性を利用することで、水の使用量を削減するために AI モデルのトレーニングと推論を動的にスケジュールできます。
たとえば、小規模な AI モデルをトレーニングする場合、トレーニング タスクを深夜にスケジュールしたり、水効率の良いデータ センターの場所でスケジュールしたりできます。同様に、水を意識する一部のユーザーは、水の効率が良い時間帯や水の効率の良いデータセンターで AI モデルの推論サービスを使用することを好む場合があり、これは推論のための AI モデルの水フットプリントの削減に貢献する可能性があります。
このような需要側の水管理は、供給側に焦点を当てた既存のエンジニアリングベースの現場での節水アプローチを補完します。また、当社のアプローチはソフトウェアベースであるため、気候条件や新しい冷却システムの設置に関する特別な要件なしに、あらゆる冷却システムと無料で併用できます。
透明性を高めることで、最も水効率の高い AI モデルがいつ、どこにあるのかを正確に知ることができるようになります。
サイード: あなたは、有益な次のステップとして透明性を提案しています。透明性を高めれば、どのような質問に答えることができるでしょうか?
Ren:透明性を高めることで、最も水効率の高い AI モデルがいつ、どこにあるのかを正確に知ることができるようになります。
透明性により、AI モデルのウォーター フットプリントの測定、ベンチマーク、改善も可能になり、研究コミュニティにとって非常に価値のあるものとなります。現在、一部の AI カンファレンスでは、論文の中で AI モデルの二酸化炭素排出量を宣言するよう著者に求めています。透明性と認識があれば、作成者は AI モデルの水のフットプリントを環境への影響の一部として宣言することもできると私たちは信じています。
このような情報を使用すると、AI モデル開発者は AI モデルのトレーニングをより適切にスケジュールでき、また、時空間の多様性を利用してユーザーの推論リクエストをより適切にルーティングして、他のパフォーマンス指標をほとんどまたはゼロに低下させることなく水を節約できます。
さらに、透明性により、ユーザーは実行時にウォーター フットプリントを知ることができ、ウォーター フットプリントを改善することもできます (たとえば、可能であれば、一部の緊急でない推論リクエストを水効率の高い時間帯に延期したい場合があります)。
Apple は、充電に低炭素時間を選択することで、クリーン エネルギーのスケジュール設定を iPhone 製品に統合しました。将来的には、水を意識した AI のトレーニングと推論も実現できることを期待しています。
これが私と同じように示唆に富むものだと思っていただければ幸いです。これは特に身近なところで起こりました。私の父と妹は二人とも水資源エンジニアであり、私は干ばつに悩まされている南カリフォルニアで育ちました。確かに私たちはテクノロジーブームに乗っていますが、イノベーションは公共の利益に役立つべきであり、公共の利益を破壊するものではありません。
読んでくれてありがとう!
いつも、
ナビハ・サイード
最高経営責任者
マークアップ
ここでも公開されています
UnsplashのDavid Beckerによる写真