Google 推出 Gemini 3.1 系列的策略佈局是什麼?Pro 與 Flash-Lite 的分工如何滿足企業 AI 基礎設施的需求? | 數位時代

Google Gemini 3.1 系列策略佈局:Pro 與 Flash-Lite 分工

Google 推出 Gemini 3.1 系列旨在滿足企業 AI 基礎設施的不同需求。Gemini 3.1 Pro 專注於高算力推理,而 Gemini 3.1 Flash-Lite 則定位為成本最低、延遲最短的模型,適用於需要即時回應的高頻應用場景。透過這種分工,Google 期望能全面覆蓋企業在 AI 應用上的各種需求。

Gemini 3.1 Flash-Lite 的特點與應用

Gemini 3.1 Flash-Lite 定價為每百萬輸入 token 0.25 美元,輸出 token 1.5 美元,相較於 Gemini 3 Flash,整體費用降低約一半。此外,Flash-Lite 的首次回應延遲較 Gemini 2.5 Flash 快 2.5 倍,輸出速率提升 45%,達到每秒 388.8 個 token。Google 將其定位為「規模化智慧」的主力引擎,適用於客服、內容審核、使用者介面生成以及大量翻譯任務等高頻應用。

「思考等級」功能與基準測試表現

Gemini 3.1 Flash-Lite 的「思考等級」功能允許開發者在「最低」、「低」、「中」、「高」四個推理深度之間動態調整,以兼顧成本與準確度。在 GPQA Diamond 基準測試中,Flash-Lite 得分達 86.9%,Arena.ai 排行榜 Elo 分數為 1432,超越前幾代較大型的 Gemini 模型。VentureBeat 認為,Gemini 3.1 系列的策略意圖清晰:Pro 負責「動腦」,Flash-Lite 負責「動手」,共同覆蓋企業 AI 基礎設施的全層需求。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容