BBU如何保護AI晶片和AI伺服器避免因斷電而受損?
Answer
BBU 如何保護 AI 晶片與伺服器
BBU(電池備援電力模組)在保護 AI 晶片和 AI 伺服器免受斷電損害方面扮演關鍵角色。摩根大通的報告指出,NVIDIA 預計在 2025 年推出的 GB300 伺服器將採用 BBU 作為標準配備,以降低伺服器運作時的風險。
BBU 與 UPS 的區別與互補
與傳統的 UPS(不斷電系統)不同,BBU 安裝在伺服器內部,主要由鋰電池模組構成。UPS 通常使用鉛蓄電池,需要額外的機房空間,並且能提供較長時間(幾分鐘至幾小時)的電力供應,適用於整個機房設施。而 BBU 則能在外部電源中斷時,提供數秒至幾分鐘的緊急供電,將儲存在 DRAM 中的快取資料快速寫入 SSD 中,以防止數據遺失。BBU 的優勢在於體積小、成本較低,且不佔用額外機房空間,使其在空間運用上更為靈活。從長遠來看,BBU 和 UPS 將形成互補,根據資料中心的建置成本和空間密度考量進行調整。
BBU 的具體保護機制
BBU 的核心功能在於應對突發斷電情況,保護高價值的 AI 晶片、AI 伺服器及其儲存的寶貴資料。當主電源和備用電源都失效時,BBU 能立即啟動,確保伺服器有足夠的電力將關鍵資料寫入備份儲存裝置,防止資料損壞或丟失。這種保護機制對於維持 AI 伺服器的穩定運作至關重要,尤其是在需要持續運算和儲存大量資料的環境中。