Google 推出 Gemini 3.1 系列的策略佈局是什麼？Pro 與 Flash-Lite 的分工如何滿足企業 AI 基礎設施的需求？

Google Gemini 3.1 系列策略佈局：Pro 與 Flash-Lite 分工

Google 推出 Gemini 3.1 系列旨在滿足企業 AI 基礎設施的不同需求。Gemini 3.1 Pro 專注於高算力推理，而 Gemini 3.1 Flash-Lite 則定位為成本最低、延遲最短的模型，適用於需要即時回應的高頻應用場景。透過這種分工，Google 期望能全面覆蓋企業在 AI 應用上的各種需求。

Gemini 3.1 Flash-Lite 的特點與應用

Gemini 3.1 Flash-Lite 定價為每百萬輸入 token 0.25 美元，輸出 token 1.5 美元，相較於 Gemini 3 Flash，整體費用降低約一半。此外，Flash-Lite 的首次回應延遲較 Gemini 2.5 Flash 快 2.5 倍，輸出速率提升 45%，達到每秒 388.8 個 token。Google 將其定位為「規模化智慧」的主力引擎，適用於客服、內容審核、使用者介面生成以及大量翻譯任務等高頻應用。

「思考等級」功能與基準測試表現

Gemini 3.1 Flash-Lite 的「思考等級」功能允許開發者在「最低」、「低」、「中」、「高」四個推理深度之間動態調整，以兼顧成本與準確度。在 GPQA Diamond 基準測試中，Flash-Lite 得分達 86.9%，Arena.ai 排行榜 Elo 分數為 1432，超越前幾代較大型的 Gemini 模型。VentureBeat 認為，Gemini 3.1 系列的策略意圖清晰：Pro 負責「動腦」，Flash-Lite 負責「動手」，共同覆蓋企業 AI 基礎設施的全層需求。

Google 推出 Gemini 3.1 系列的策略佈局是什麼？Pro 與 Flash-Lite 的分工如何滿足企業 AI 基礎設施的需求？ | 數位時代

Google Gemini 3.1 系列策略佈局：Pro 與 Flash-Lite 分工

Gemini 3.1 Flash-Lite 的特點與應用

「思考等級」功能與基準測試表現