Питание экологичных центров обработки данных

Искусственный интеллект (ИИ) стремительно развивается и проникает во многие аспекты нашей повседневной жизни - от создания контента до онлайн-чатботов, обеспечивающих обслуживание клиентов. За этим стоит огромный рост объемов обработки данных, большая часть которых требует мощной вычислительной инфраструктуры. Прежде чем модели ИИ будут готовы к использованию, им необходимо пройти обучение и сделать выводы, которые обычно выполняются в современных центрах обработки данных.

В современном центре обработки данных, как правило, находятся многие тысячи высокопроизводительных серверов. Каждый из них требует значительного количества энергии, как для работы, так и для охлаждения. В связи с повсеместным быстрым ростом потребление энергии в секторе центров обработки данных с искусственным интеллектом растет, что вызывает обеспокоенность по поводу устойчивости и воздействия этой технологической революции на окружающую среду.

По оценкам Международного энергетического агентства (МЭА), на центры обработки данных приходится 1,5% от общего спроса на электроэнергию - около 415 тераватт-часов (ТВтч) в 2024 году. Ожидается, что к 2030 году потребление вырастет более чем в два раза и составит около 945 ТВт-ч, а затем увеличится до 3%. Поскольку центры обработки данных часто располагаются в одном месте, это может привести к значительной нагрузке на электросети.

Инженерия будущего: Адаптация архитектуры питания центров обработки данных для искусственного интеллекта

По сравнению с обычным веб-пользованием, таким как поиск, энергия, необходимая для искусственного интеллекта, гораздо выше, часто в десять раз. В первую очередь это связано с мощными графическими процессорами, каждый из которых может потреблять сотни ватт. Особенно много энергии потребляют обучаемые модели - например, для обучения GPT-4 требуется 25 000 графических процессоров NVIDIA A100 в течение 3 месяцев, что потребляет 50 гигаватт-часов (ГВтч) энергии и обходится в $100 миллионов, согласно данным OpenAI.

ИИ не замедляет своего развития, а удваивает потребление энергии каждые полгода, причем эта отрасль потребляет столько же энергии, сколько небольшая страна. При таких масштабах потери представляют собой реальную проблему. При передаче и распределении электроэнергии из-за сопротивления кабелей теряется до 6% энергии. Энергия, поступающая из сети в GPU, преобразуется более четырех раз, в результате чего в среднем теряется 12% энергии.

Каждый из тысяч серверов может потреблять 40 киловатт (кВт), поэтому для передачи энергии к стойкам используется сверхмощная шина. Стандартные 12 вольт постоянного тока (VDC) шина превратилась в 48 ВDC для снижения токов. Но для удовлетворения потребности в энергии для искусственного интеллекта необходимо более высокое напряжение +/-400 В.DC Скорее всего, потребуется архитектура шины.

Рисунок 1. Центры обработки данных требуют нескольких ступеней преобразования энергии

Силовые полупроводники необходимы для эффективного преобразования энергии в соответствии с потребностями процессоров искусственного интеллекта и графических процессоров. Карбид кремния (SiC) и нитрид галлия (GaN) приходят на смену кремнию, поскольку позволяют создавать очень компактные и энергоэффективные преобразователи питания, значительно повышая совокупную стоимость владения (TCO) центров обработки данных.

Инновационные решения для повышения эффективности и устойчивости

Электропитание центра обработки данных от сети до стойки GPU проходит через множество преобразований. Интеллектуальные силовые решения на основе SiC и кремния (Si) играют важную роль в каждой ветви дерева питания. Сначала питание проходит через твердотельный трансформатор (SST) и автоматический переключатель (ATS), который поддерживается дизельным генератором. Напряжение 20 кВAC линия преобразуется в трехфазную 400 ВAC, а затем проходит через источник бесперебойного питания (ИБП). Дискретные и силовые модули EliteSiC могут использоваться для обеспечения более высокой эффективности и плотности мощности в этой точке входа в центр обработки данных. Затем блок распределения питания преобразует трехфазное напряжение 400 В.AC к однофазной сети 230 ВAC линия на уровне стойки.

В стойке, где расположены серверы GPU, происходит остальная часть преобразования энергии. В блоке питания (БП) и блоке резервного питания сочетание каскодных JFET SiC и Si MOSFET PowerTrench T10 идеально подходит для мощных решений AC-to-DC. Высокотоковые каскодные JFET SiC необходимы для перехода от блоков питания мощностью 3 кВт к блокам питания мощностью 5 кВт, которые требуются в гипермасштабных архитектурах нового поколения.

МОП-транзисторы EliteSiC 650 В и МОП-транзисторы T10 от onsemi используются для преобразования напряжения 230 В.AC напряжение сети до 48 ВDC сначала, а затем до 12 ВDC по потоку мощности. Эффективность преобразования является ключевым фактором для поддержания пиковой эффективности 97,5% в соответствии со спецификацией Open Rack V3 (ORV3). Такая высокая эффективность снижает потери энергии и помогает снизить эксплуатационные расходы и потребность в охлаждении. МОП-транзисторы T10 Si и микросхемы управления питанием также используются для преобразования напряжения 48 В в напряжение промежуточного шинного преобразователя (IBC) 12 В для питания ветви Vcore (напряжение ядра процессора) дерева питания. Кроме того, в шинных архитектурах 400/800 В SiC JFET и SiC Combo JFET обеспечивают надежную защиту от перегрузки по току при горячей замене/e-Fuse перед этапом IBC.

Будущее управления питанием в центрах обработки данных с искусственным интеллектом 

Эффективность - самый важный параметр энергопотребления в центрах обработки данных с искусственным интеллектом. Это означает, что потери должны быть сведены к минимуму везде, где это возможно, не в последнюю очередь потому, что охлаждение может потреблять до 50% энергии, используемой в центрах обработки данных, в то время как другая половина потребляется ИТ-оборудованием, таким как серверы, системы хранения данных и инфраструктура питания.

Компания onsemi является лидером в области решений для центров обработки данных с искусственным интеллектом и одним из немногих поставщиков, способных удовлетворить потребности всего дерева питания - от сети до GPU. В будущем потребуются передовые технологии с широкой полосой пропускания, такие как EliteSiC и вертикальный GaN от onsemi, благодаря их надежному преобразованию энергии на более высоких частотах и более высокому КПД, позволяющему создавать более компактные конструкции. Эти устройства могут надежно работать при более высоких температурах, требуя меньше охлаждения и позволяя создавать более компактные решения, а также снижать эксплуатационные расходы.