相較於前一代Hopper架構,Blackwell架構在散熱設計上面臨哪些新的挑戰? | 數位時代

Blackwell 架構在散熱設計上面臨的新挑戰

相較於前一代 Hopper 架構,NVIDIA 的 Blackwell 架構在散熱設計上面臨更嚴峻的挑戰。主要原因是 Blackwell 晶片在效能提升的同時,功耗也大幅增加,導致伺服器出現過熱問題。據報導,Blackwell GPU 連接設計可搭載多達 72 個晶片的機架伺服器時,過熱情況尤為明顯。

過熱問題對客戶的影響

Blackwell 晶片的過熱問題不僅影響了 NVIDIA 的出貨時程,也讓部分客戶感到擔憂。這些客戶擔心沒有足夠的時間來籌備和運行新的數據中心,因為過熱問題可能導致系統不穩定,甚至造成硬體損壞。為了解決這些問題,NVIDIA 已經數度要求供應商變更機櫃設計,以改善散熱效果。

NVIDIA 的應對措施

面對 Blackwell 晶片過熱的問題,NVIDIA 表示正與領先的雲端服務供應商合作,透過工程上的迭代來解決。NVIDIA 強調,這是一個正常且符合預期的過程。儘管如此,Blackwell 的延遲出貨和過熱問題,可能會對 Meta、Google 和 Microsoft 等業者造成影響,因為這些公司都高度仰賴 NVIDIA 的 GPU 來推動其 AI 運算。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容