지속 가능한 데이터 센터 지원

인공지능(AI)은 콘텐츠 제작부터 고객 서비스를 제공하는 온라인 챗봇에 이르기까지 우리 일상의 다양한 측면에 빠르게 침투하며 그 영역을 확장하고 있습니다. 그 이면에는 데이터 처리의 엄청난 증가가 있으며, 이 중 상당 부분은 강력한 컴퓨팅 인프라를 필요로 합니다. AI 모델을 사용하기 전에 일반적으로 고급 데이터 센터에서 수행되는 트레이닝과 추론이 필요합니다.

최신 데이터 센터에는 일반적으로 수천 대의 고성능 서버가 있습니다. 이러한 서버는 각각 운영과 냉각을 위해 상당한 에너지를 필요로 합니다. AI 데이터센터 부문이 급속도로 성장함에 따라 에너지 소비가 급증하고 있으며, 이로 인해 지속 가능성과 이 기술 혁명이 환경에 미치는 영향에 대한 우려가 커지고 있습니다.

국제에너지기구(IEA)는 2024년 데이터센터가 전체 전력 수요의 1.5%(약 415테라와트시)를 차지할 것으로 추정합니다. 소비량은 약 945TWh로 두 배 이상 증가하여 2030년에는 약 3%의 비중으로 늘어날 것으로 예상됩니다. 데이터 센터가 여러 곳에 밀집되어 있는 경우가 많기 때문에 전력망에 상당한 부담을 줄 수 있습니다.

미래를 위한 엔지니어링: AI를 위한 데이터센터 전력 아키텍처 적용

검색과 같은 일반적인 웹 사용과 비교할 때, AI에 필요한 에너지는 10배 이상 훨씬 높습니다. 이는 주로 수백 와트를 소비할 수 있는 강력한 그래픽 처리 장치(GPU)가 필요하기 때문입니다. OpenAI에 따르면 GPT-4를 훈련하는 데 3개월 동안 25,000개의 NVIDIA A100 GPU가 필요하며, 50기가와트시(GWh)의 에너지를 소비하고 $100억의 비용이 드는 등 훈련 모델은 특히 전력 소모가 심합니다.

AI는 속도가 느려지기는커녕 6개월마다 전력 소비량을 두 배로 늘리고 있으며, 업계는 작은 국가만큼이나 많은 에너지를 소비하고 있습니다. 이 정도 규모라면 손실은 심각한 문제입니다. 송배전 과정에서 전기가 이동하면서 케이블의 저항으로 인해 최대 6%의 에너지가 낭비됩니다. 그리드에서 GPU로의 전력은 4배 이상 변환되어 평균 12%의 에너지가 손실됩니다.

수천 대의 서버 각각은 40킬로와트(kW)를 소비할 수 있으므로 랙으로 전력을 이동하기 위해 대형 버스가 사용됩니다. 표준 12볼트의 직류(VDC) 버스가 48V로 진화했습니다.DC 를 사용하여 전류를 줄입니다. 그러나 AI에 대한 에너지 수요를 해결하려면 더 높은 +/-400VDC 버스 아키텍처가 필요할 가능성이 높습니다.

그림 1: 데이터 센터에는 여러 전력 변환 단계가 필요합니다.

전력 반도체는 AI 프로세서와 GPU의 요구 사항을 충족하기 위해 전력을 효율적으로 변환하는 데 필수적입니다. 실리콘 카바이드(SiC)와 질화 갈륨(GaN)은 매우 컴팩트하고 에너지 효율적인 전력 변환기를 구현하여 데이터센터의 총소유비용(TCO)을 크게 개선함으로써 실리콘을 대체하고 있습니다.

효율성과 지속 가능성을 위한 혁신적인 솔루션

그리드에서 GPU 랙으로 데이터센터 전력을 공급하려면 많은 전력 변환을 거쳐야 합니다. 지능형 SiC 및 실리콘(Si) 전력 솔루션은 전력 트리의 각 지점에서 중요한 역할을 합니다. 전력은 먼저 솔리드 스테이트 변압기(SST)와 자동 전송 스위치(ATS) 제어를 거쳐 디젤 발전기에 의해 백업됩니다. 20k VAC 라인은 3상 400V로 변환됩니다.AC, 를 거쳐 무정전 전원 공급 장치(UPS)를 거칩니다. 이 데이터센터 진입 지점에서 더 높은 효율과 전력 밀도를 제공하기 위해 EliteSiC 개별 및 전력 모듈을 사용할 수 있습니다. 그런 다음 전력 분배 장치는 3상 400VAC 단상 230V로AC 줄을 랙 레벨에 추가합니다.

GPU 서버가 위치한 랙에서 나머지 전력 변환이 이루어집니다. 전원 공급 장치(PSU) 및 배터리 백업 장치 내에서 SiC 캐스코드 JFET과 PowerTrench T10 Si MOSFET의 조합은 고전력 AC-DC 솔루션에 이상적입니다. 고전류 SiC 캐스코드 JFET은 차세대 하이퍼스케일 아키텍처에 필요한 3kW에서 5kW PSU로 전환하는 데 필수적입니다.

230V 변압에 사용되는 온세미(onsemi)의 EliteSiC 650V MOSFET 및 T10 MOSFETAC 라인 전압을 48V로DC 먼저 12V로 전환한 다음DC 전력 흐름을 따라. 변환 효율은 오픈 랙 V3(ORV3) 사양인 97.5% 피크 효율을 유지하기 위한 핵심 요소입니다. 이러한 높은 효율은 낭비되는 에너지를 줄이고 운영 비용과 냉각 수요를 낮추는 데 도움이 됩니다. 또한 48V를 12V의 중간 버스 컨버터(IBC) 전압으로 변환하여 파워 트리의 Vcore(CPU 코어 전압) 분기에 전원을 공급하는 데에도 T10 Si MOSFET 및 전원 관리 IC가 사용됩니다. 또한 400/800V 버스 아키텍처의 경우 SiC JFET 및 SiC 콤보 JFET은 IBC 단계 이전의 핫 스왑/e-Fuse에 안정적인 과전류 보호 기능을 제공합니다.

AI 데이터센터의 전력 관리의 미래 

효율성은 AI 데이터센터에서 가장 중요한 전력 매개변수입니다. 데이터센터에서 사용되는 전력의 최대 절반은 냉각에 소비되고 나머지 절반은 서버, 스토리지 시스템, 전력 인프라 등 IT 장비에서 소비되기 때문에 가능한 한 손실을 최소화해야 합니다.

온세미는 AI 데이터센터 솔루션의 선두주자이며, 그리드에서 GPU까지 전체 전력 트리의 요구 사항을 충족할 수 있는 몇 안 되는 공급업체 중 하나입니다. 미래에는 더 높은 주파수에서 강력한 전력 변환과 더 컴팩트한 설계를 가능하게 하는 더 높은 효율을 위해 온세미의 EliteSiC 및 수직 GaN과 같은 고급 와이드 밴드 갭 기술이 필요합니다. 이러한 장치는 더 높은 온도에서도 안정적으로 작동할 수 있어 냉각이 덜 필요하고 더 컴팩트한 솔루션을 구현할 수 있을 뿐만 아니라 운영 비용도 절감할 수 있습니다.