輝達 (NVIDIA) 開源 Nemotron 3 並非為了直接與其他大型 AI 模型競爭,而是旨在建立一個開放的生態系統。此舉讓開發者能基於此平台進行 AI 應用開發,著重於提供高效能的基礎建設,以滿足企業對 AI 代理日益增長的需求。
Nemotron 3 的設計理念強調在推理能力與運算效率之間取得平衡,採用混合專家模型 (Mixture of Experts) 以提高運算效率。這種模型能針對不同需求啟用部分「專家」,而非每次都動用完整模型,從而降低推論成本並提高回應速度。此外,Nemotron 3 也具備長上下文處理能力,有助於減少模型在多次呼叫之間遺失脈絡,提升多步驟任務的連貫性。
針對 Nemotron 3 的開源是否與輝達 CUDA 策略產生衝突的質疑,輝達表示 CUDA-X 生態系本來就同時存在封閉與開源函式庫,Nemotron 延續的正是這套既有做法。輝達選擇將需要快速擴散、建立開發者與企業採用基礎的層級開放,其餘關鍵技術仍由自家掌握。這種策略有助於降低企業導入 AI 的門檻,並隨著 AI 應用逐漸轉為長時間運作、涵蓋多個代理與流程,企業對於算力與平台資源的需求,將會從一次性使用轉為長期投入,進而推動 GPU 等硬體設備的成長動能。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容