Горячие взгляды на искусственный интеллект повсюду: в зависимости от того, куда вы посмотрите, генеративный ИИ либо убьет нас, либо отнимет наши рабочие места, освободит нас от тяжелой работы, либо будет стимулировать огромные инновации. (В любом случае, здесь звучат призывы к регулированию .) В The Markup нам нравится использовать взвешенный подход, который часто включает в себя измерение реальных последствий.
Поэтому я очень рад поделиться этими вопросами и ответами с доцентом кафедры информатики Калифорнийского университета в Риверсайде Шаолеем Реном , который вместе со своей командой — доктором философии из Риверсайда. Кандидаты Пэнфэй Ли и Цзяньи Ян , а также Мохаммад А. Ислам , доцент кафедры информатики Техасского университета в Арлингтоне, недавно опубликовали статью, в которой количественно оценивается секретный водный след ИИ .
Несмотря на то, что углеродному следу новых технологий уделяется некоторое внимание, для того, чтобы действительно обеспечить устойчивое развитие, вода также должна быть частью уравнения.
И ещё, здравствуйте! Я Набиха Сайед, генеральный директор The Markup, и я человек, который верит, что технологический прогресс может сосуществовать со здоровой планетой — если мы сделаем это приоритетом. Продолжайте читать, чтобы узнать, сколько воды может «выпить» один диалог ChatGPT, а также о конкретных шагах, которые мы можем предпринять, чтобы уменьшить «водный след» ИИ.
(Эти вопросы и ответы были отредактированы для краткости и ясности.)
Сайед: По очень веской причине мы начинаем видеть более пристальное внимание к углеродному следу различных технологий, включая модели искусственного интеллекта, такие как GPT-3 и GPT-4, а также майнинг биткойнов . Но ваше исследование сосредоточено на том, чему уделяется меньше внимания: секретном водном следе технологии искусственного интеллекта. Расскажите нам о своих выводах.
Рен: Водный след остается вне поля зрения по разным причинам, включая большое заблуждение, что пресная вода является «бесконечным» ресурсом, и относительно низкую цену воды. Многие разработчики моделей ИИ даже не осознают своего водного следа. Но это не означает, что водный след не важен, особенно в засушливых регионах, таких как Калифорния.
Вместе со своими студентами и коллегой из UT в Арлингтоне я провел небольшое исследование водного следа ИИ, используя современную методологию оценки. Мы обнаружили, что крупномасштабные модели ИИ действительно являются крупными потребителями воды.
Например, обучение GPT-3 в современных центрах обработки данных Microsoft в США может напрямую потреблять 700 000 литров чистой пресной воды (достаточно для производства 370 автомобилей BMW или 320 электромобилей Tesla), а потребление воды было бы утроено, если бы обучение проводилось в центрах обработки данных Microsoft в Азии. Эти цифры не включают в себя водный след за пределами объекта, связанный с выработкой электроэнергии.
Для вывода (т. е. разговора с ChatGPT), наша оценка показывает, что ChatGPT требуется бутылка воды объемом 500 мл для короткого разговора, состоящего примерно из 20–50 вопросов и ответов, в зависимости от того, когда и где используется модель. Учитывая огромную базу пользователей ChatGPT, общий расход воды для вывода может быть огромным.
Затем мы дополнительно изучили уникальные пространственно-временные различия эффективности использования воды во время выполнения моделей ИИ — эффективность использования воды меняется со временем и в разных местах. Это означает, что существует потенциал сокращения потребления воды ИИ за счет динамического планирования рабочих нагрузок и задач ИИ в определенное время и в определенных местах, так же, как мы сокращаем счета за электроэнергию, используя низкие цены на электроэнергию в ночное время для зарядки наших электромобилей.
Сайед: Как этот водный след можно сравнить с чем-то вроде, скажем, говядины?
Рен: На некоторых веб-сайтах мы можем видеть, что говядина и джинсы имеют большой водный след, но их водный след распространяется на весь жизненный цикл и включает большую часть непитьевой воды. Например, водный след джинсов начинается с роста хлопка.
В нашем исследовании мы учитываем только эксплуатационный водный след (т. е. потребление воды, связанное с обучением и запуском моделей ИИ), тогда как реальный водный след (например, водный след, связанный с производством и транспортировкой серверов ИИ, включая производство чипов) исключается. Если мы примем во внимание фактический водный след моделей искусственного интеллекта, я интуитивно чувствую, что общий водный след можно легко увеличить в 10 раз или даже больше.
Сайед: Мне особенно любопытно, как сокращение выбросов углекислого газа и сохранение воды могут противоречить друг другу. Что вы имеете в виду, когда спрашиваете, должны ли мы «следовать за солнцем или от него отходить»?
Рен: Эффективность использования воды в основном зависит от температуры наружного воздуха, а также от состава топлива для производства электроэнергии. Углеродосберегающие часы/места не означают часы/места с эффективным использованием воды, а иногда они даже противоположны друг другу.
Пользователи, заботящиеся о водных ресурсах, могут предпочесть использовать услуги вывода моделей искусственного интеллекта в часы водосбережения и/или в водосберегающих центрах обработки данных….
Например, в Калифорнии около полудня наблюдается высокая выработка солнечной энергии, и это приводит к наибольшему снижению выбросов углекислого газа в часы, но около полудня наружная температура также высока, и, следовательно, эффективность использования воды наихудшая. В результате, если мы будем рассматривать только сокращение выбросов углекислого газа (скажем, запланировав больше тренировок ИИ примерно на полдень), мы, скорее всего, столкнемся с более высоким потреблением воды, что не является действительно устойчивым для ИИ.
С другой стороны, если мы только сократим водный след (скажем, запланировав обучение ИИ на полночь), мы можем увеличить углеродный след из-за меньшего количества доступной солнечной энергии.
Сайед: Понятно, что такие технологические гиганты, как Microsoft, Google и Amazon, делают большие ставки на будущее искусственного интеллекта, но видим ли мы, что они делают экологические соображения приоритетом в своем развитии?
Рен: Да, мы видели, как загрязнение воды становится приоритетом в отчетах об устойчивом развитии нескольких технологических гигантов, таких как Google , Microsoft и Meta .
Кроме того, законодатели недавно начали учитывать влияние использования воды центрами обработки данных на местную окружающую среду. Например, в Вирджинии, где округ Лаудон известен как «мировая столица центров обработки данных», SB 1078 , предложенный в начале этого года, потребует «оценки объекта… для изучения влияния центра обработки данных на потребление воды и выбросы углекислого газа». выбросы, а также любое воздействие на сельскохозяйственные ресурсы».
До сих пор большая часть усилий отрасли была сосредоточена на повышении эффективности использования воды на объекте с «инженерной» точки зрения, например, на повышении эффективности градирни центра обработки данных и переработке оборотной воды вместо использования местных ресурсов питьевой воды. Тем не менее, подавляющее большинство центров обработки данных по-прежнему используют питьевую воду и градирни.
Например, даже такие технологические гиганты, как Google, в значительной степени полагаются на градирни и потребляют миллиарды литров питьевой воды каждый год.
Такое огромное потребление воды создало нагрузку на местную водную инфраструктуру; Центр обработки данных Google использовал более четверти всей воды в Даллесе, штат Орегон. Более того, многие центры обработки данных также расположены в подверженных засухе районах, таких как Калифорния.
Наше исследование показывает, что «когда» и «где» обучать большую модель ИИ может существенно повлиять на водный след.
Основная причина заключается в пространственно-временном разнообразии эффективности использования воды (ЭВП) как на площадке, так и за ее пределами: изменения ЭИВ на площадке из-за изменений внешних погодных условий, а изменения ЭИВ за пределами площадки из-за изменений в энергосистеме. смеси энергетического топлива для удовлетворения меняющихся во времени потребностей. Фактически, ЭИВ меняется гораздо быстрее, чем ежемесячно или сезонно.
Таким образом, используя пространственно-временное разнообразие WUE, мы можем динамически планировать обучение модели ИИ и делать выводы, чтобы сократить потребление воды.
Например, если мы обучаем небольшую модель ИИ, мы можем запланировать задачу обучения на полночь и/или в центре обработки данных с более высокой эффективностью использования воды. Аналогичным образом, некоторые пользователи, заботящиеся о водных ресурсах, могут предпочесть использовать услуги вывода моделей ИИ в часы, когда водосберегает вода, и/или в водосберегающих центрах обработки данных, что может способствовать уменьшению потребления воды моделями ИИ для вывода.
Такое управление водными ресурсами со стороны спроса дополняет существующие инженерно-ориентированные подходы к водосбережению на местах, ориентированные на предложение. Кроме того, наш подход основан на программном обеспечении и, следовательно, может бесплатно использоваться с любыми системами охлаждения без особых требований к климатическим условиям или установке новой системы охлаждения.
Имея больше прозрачности, мы сможем точно знать, когда и где у нас есть наиболее водосберегающие модели ИИ.
Сайед: Вы предлагаете прозрачность как полезный следующий шаг. На какие вопросы нам могла бы помочь большая прозрачность?
Рен: Благодаря большей прозрачности мы сможем точно знать, когда и где у нас появятся наиболее водосберегающие модели искусственного интеллекта.
Прозрачность также позволяет измерять, сравнивать и улучшать водный след моделей ИИ, что может иметь большую ценность для исследовательского сообщества. В настоящее время некоторые конференции по искусственному интеллекту требуют, чтобы авторы указывали в своих статьях углеродный след своих моделей искусственного интеллекта; мы считаем, что благодаря прозрачности и осведомленности авторы также могут объявить водный след своих моделей ИИ частью воздействия на окружающую среду.
Имея такую информацию, разработчики моделей ИИ могут лучше планировать обучение своих моделей ИИ, а также использовать пространственно-временное разнообразие, чтобы лучше направлять запросы пользователей на логические выводы для экономии воды с минимальным или нулевым ухудшением других показателей производительности.
Кроме того, прозрачность также может позволить пользователям узнать свой водный след во время выполнения и улучшить его водный след (скажем, они могут захотеть отложить некоторые несрочные запросы на получение выводов до часов, когда это позволяет экономить воду).
Apple интегрировала планирование экологически чистой энергии в свои продукты iPhone, выбрав часы с низким уровнем выбросов углекислого газа для зарядки, и мы надеемся, что обучение ИИ и выводы с учетом воды также могут быть превращены в реальность в будущем.
Надеюсь, вы нашли это таким же поводом для размышлений, как и я! Этот случай особенно затронул мой дом: мои отец и сестра оба инженеры по водным ресурсам, а я вырос в пронизанной засухой Южной Калифорнии. Конечно, мы переживаем технологический бум, но инновации должны служить нашему общественному благу, а не уничтожать его.
Спасибо за прочтение!
Всегда,
Набиха Сайед
Директор компании
Разметка
Также опубликовано здесь
Фото Дэвида Беккера на Unsplash