AI 領域正經歷從著重模型訓練到更重視模型推理的重大轉變。過去,AI 的發展重心在於如何透過大量數據訓練出高效能的模型,NVIDIA 的 GPU 在此階段扮演了關鍵角色。然而,隨著技術成熟,AI 的應用價值日益凸顯,如何將這些訓練有素的模型實際應用於解決問題,變得更加重要。這意味著 AI 的競爭已進入下半場,重點在於如何高效、經濟地進行推理,以滿足真實世界的需求。
Google 最新推出的第七代 TPU Ironwood,其設計目標正是為了提升 AI 推理的效率和規模。Ironwood 單晶片具有強大的浮點運算能力,且能組成超大規模的運算集群,顯示 Google 正積極擴展其在 AI 基礎設施上的能力。Google 明確指出,雖然 NVIDIA 在訓練領域領先,但 AI 的真正競爭在於推理。Ironwood 的設計著重於大規模、高效率和低成本的推理能力,這顯示 Google 正在重新定義 AI 戰場的競爭格局。
Google 採取垂直整合策略,從底層的 Ironwood 晶片設計到上層的軟體框架,實現了軟硬體的協同優化。這種策略不僅提升了效能,也降低了成本。Anthropic 選擇將其 Claude 模型的部署押注在 Ironwood 上,這筆巨額訂單是對 Google 策略的有力驗證。Anthropic 作為 OpenAI 的主要競爭對手,其選擇顯示市場對 Google 在 AI 推理領域的潛力具有高度信心。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容