應(yīng)對(duì)人工智能數(shù)據(jù)中心的電力挑戰(zhàn)
國(guó)際能源署(IEA)的數(shù)據(jù)表明,2022 年數(shù)據(jù)中心的耗電量約占全球總用電量的 2%,達(dá)到 460 TWh 左右。如今,加密貨幣和人工智能/機(jī)器學(xué)習(xí) (AI/ML) 等高耗能應(yīng)用方興未艾,而這些技術(shù)中通常需要部署大量的高性能圖形處理單元 (GPU)。因此,數(shù)據(jù)中心耗電量仍將不斷攀升。
人工智能應(yīng)用的擴(kuò)展速度令人震驚。ChatGPT 上線僅 5 天,用戶數(shù)量就達(dá)到了 100 萬(wàn),并在 2 個(gè)月內(nèi)突破了 1 億,這一增長(zhǎng)速度遠(yuǎn)超于 TikTok 和 Instagram。GPT-4 訓(xùn)練包含超過(guò) 1.7 萬(wàn)億參數(shù)和 13 萬(wàn)億 token,總共使用了 2.5 萬(wàn)個(gè) NVIDIA A100 GPU,每臺(tái)服務(wù)器的功耗約為 6.5 kW。據(jù) OpenAI 稱,GPT-4 的訓(xùn)練耗時(shí) 100 天,消耗能源約 50 GWh,耗資 1 億美元。
在當(dāng)前環(huán)境中,我們很難準(zhǔn)確估計(jì)未來(lái)耗電情況,其中為支持人工智能而部署的GPU 消耗了大部分電力。國(guó)際能源署保守預(yù)測(cè),到 2026 年,數(shù)據(jù)中心的耗電量將至少達(dá)到 650 TWh,甚至可能超過(guò) 1,000 TWh。
人工智能數(shù)據(jù)中心的架構(gòu)演變
早期數(shù)據(jù)中心將電網(wǎng)電壓集中轉(zhuǎn)換為12V,然后通過(guò)總線將電力傳輸至服務(wù)器,再通過(guò)邏輯電平轉(zhuǎn)換器將電壓轉(zhuǎn)換為 3.3/5V。然而功率需求不斷提升,這種供電方法的電能損耗變得不可接受。因此,母線電壓被提高到 48V,電流減小到原來(lái)的 1/4,損耗降低到了原來(lái)的 1/16。
而目前處理器電壓進(jìn)一步降低,從3.3V 降到了低于 1V 的亞伏特級(jí)別,此時(shí)就需要使用多條功率相對(duì)較高的電壓軌。這進(jìn)而催生了兩級(jí)電壓轉(zhuǎn)換方案。該方案使用 DC-DC 轉(zhuǎn)換器作為中間總線轉(zhuǎn)換器 (IBC),先將 48V 電壓轉(zhuǎn)換為 12V 的局部總線電壓,然后再將此轉(zhuǎn)換為所需的低電壓。
圖1:典型服務(wù)器電源架構(gòu) – 中間總線
人工智能數(shù)據(jù)中心需要高能效電源轉(zhuǎn)換
功率損耗帶來(lái)了雙重挑戰(zhàn),不僅會(huì)造成能源浪費(fèi)、增加運(yùn)營(yíng)成本,而且會(huì)產(chǎn)生大量熱量,進(jìn)而需占用更大空間、消耗更多成本。運(yùn)營(yíng)超大規(guī)模人工智能數(shù)據(jù)中心時(shí),機(jī)架功率需求為120 kW。將電網(wǎng)電力轉(zhuǎn)換為 GPU 所用電壓的能效約為 88%,這意味著會(huì)產(chǎn)生大約 15 kW 廢熱,并需要通過(guò)液冷技術(shù)進(jìn)行有效散熱。
在服務(wù)器電源設(shè)計(jì)中,能效和功率密度是兩個(gè)重要概念,二者相輔相成。我們必須盡可能高效地將來(lái)自電網(wǎng)的能量轉(zhuǎn)換為有用功率,減少損耗。為此,電源拓?fù)洳粩嘌葑?,業(yè)界開(kāi)發(fā)了同步整流等技術(shù),并在整流器中采用MOSFET 取代了損耗較大的二極管。
改進(jìn)拓?fù)浣Y(jié)構(gòu)只成功了一半。為了優(yōu)化能效,還必須盡可能提高所有元器件的能效,尤其是對(duì)轉(zhuǎn)換過(guò)程至關(guān)重要的MOSFET。
MOSFET 并非無(wú)損耗器件,在導(dǎo)通和開(kāi)關(guān)過(guò)程中也會(huì)產(chǎn)生損耗。隨著服務(wù)器電源不斷提高運(yùn)行頻率以縮小尺寸,開(kāi)關(guān)損耗成為了優(yōu)化的重點(diǎn)。
高效PowerTrench? MOSFET
安森美(onsemi)的中低壓T10 PowerTrench?MOSFET采用了新型屏蔽柵極溝槽技術(shù),降低了開(kāi)關(guān)損耗和導(dǎo)通損耗,并進(jìn)而顯著降低了其Qg,RDS(ON) 也降至 1mOhm 以下。其中的先進(jìn)軟恢復(fù)體二極管緩解了振鈴、過(guò)沖和噪聲問(wèn)題,同時(shí)降低了 Qrr 損耗,為快速開(kāi)關(guān)應(yīng)用找到了性能與恢復(fù)時(shí)間的平衡點(diǎn)。
與早期器件相比,這些新型MOSFET 可使開(kāi)關(guān)損耗降低高達(dá) 50%,并使導(dǎo)通損耗降低 30% 以上。
圖2:PowerTrench? T10 MOSFET 的優(yōu)勢(shì)
安森美新型40V和80V T10 PowerTrench 器件的RDS(on) 表現(xiàn)出色。NTMFWS1D5N08X(80 V、1.43 mΩ、5 mm x 6 mm SO8-FL 封裝)和NTTFSSCH1D3N04XL(40 V、1.3 mΩ、3.3 mm x 3.3 mm 源極向下雙散熱封裝)具有優(yōu)異的品質(zhì)因數(shù)(FOM),是人工智能數(shù)據(jù)中心電源供應(yīng)器(PSU) 和中間總線轉(zhuǎn)換器應(yīng)用的理想選擇。T10 PowerTrenchMOSFET 符合嚴(yán)格的 Open Rack V3 能效標(biāo)準(zhǔn),即能效達(dá)到 97.5% 以上。
提交
智能工控+存儲(chǔ)-星火存儲(chǔ)打造智慧存儲(chǔ),助力產(chǎn)業(yè)創(chuàng)新
智能工控+存儲(chǔ)-金勝電子煥新品牌助力國(guó)產(chǎn)工控市場(chǎng)
?Saab UK 為深海勘探實(shí)現(xiàn)創(chuàng)新,降低潛水員及環(huán)境風(fēng)險(xiǎn)
CIMES 2024??怂箍?構(gòu)建智能制造生態(tài)系統(tǒng) 賦能行業(yè)數(shù)字化轉(zhuǎn)型
AVEVA劍維軟件在2024年倫敦科技周發(fā)布2023年度可持續(xù)發(fā)展進(jìn)度報(bào)告與首份工業(yè)智能指數(shù)