相較於NVIDIA的GPU,Google Ironwood TPU在「訓練」與「推理」的AI戰爭中,扮演了什麼樣的角色?
Answer
Google Ironwood TPU 在 AI 訓練與推理中的角色
當 NVIDIA 的 GPU 仍是市場焦點時,Google 悄然推出了其第七代 TPU,Ironwood。Google 的核心目標是將 AI 戰爭從「訓練」轉移到「應用」,即從上半場的訓練轉向下半場的推理。隨著 AI 時代的演進,「推理」變得越來越重要,Google 正試圖在這新領域中佔據主導地位。
Ironwood 的性能與設計哲學
Ironwood 單晶片的浮點運算性能達到 4.6 PetaFLOPS,可與 NVIDIA 的 Blackwell 架構媲美,甚至在某些指標上略勝一籌。Google 展示了其擴展能力,可將多達 9,216 顆 Ironwood 晶片組成一個算力高達 42.5 ExaFLOPS 的超級運算集群。這種設計哲學與 NVIDIA 不同,NVIDIA 打造的是由頂級 GPU 組成的精英戰隊,而 Google 則組建一支由近萬名基因改造士兵組成的羅馬軍團,強調規模和效率。
Google 對 AI 戰場的重新定義
Google 強調「推理時代」的到來。AI 的上半場是模型訓練,NVIDIA 的 GPU 憑藉其通用性和 CUDA 生態系統幾乎壟斷了這個市場。而 AI 的下半場是模型推理,這是一個持續的、規模遠大於訓練的日常運營。Google 承認 NVIDIA 在「訓練」上已獲勝,但認為真正的決戰在「推理」,Ironwood 就是為大規模、高效率、低成本的「推理」而生的武器。Google 的晶片設計哲學是打造為特定任務(推理)高度優化的「專用釘子」,然後用超大規模的數據中心網絡將成千上萬顆「釘子」組成一個整體,以實現規模化效率和成本控制。
Anthropic 的訂單與 Google 的技術棧
Anthropic 作為 OpenAI 的競爭對手,選擇將其 Claude 模型的規模化部署押注在 Ironwood 上,這證明了市場對 Google 策略的認可。Google 控制著從晶片設計到數據中心網絡和軟體框架的整個技術棧,實現了軟硬體的完美協同。Ironwood 不僅僅是一塊晶片,它是 Google Cloud 帝國的矛與盾。然而,Ironwood 目前僅在 Google Cloud 的「圍牆花園」內提供服務,這與 NVIDIA 向所有人出售通用武器的策略形成對比。Google 的策略雖妙,卻有其限制。
開放 vs. 封閉的哲學對決
Ironwood 的發布標誌著 AI 基礎設施戰爭進入新階段,不再是單純的晶片性能競賽,而是「開放 vs. 封閉」、「通用 vs. 專用」、「軍火商 vs. 帝國」的根本性哲學對決。