Google 推出 Gemini 3.1 Flash-Lite 模型,其主要用意在於提供開發者一個更具成本效益且反應快速的 AI 解決方案,特別適用於需要即時回應的高頻應用場景,例如客服、內容審核和介面生成。此模型導入的「思考等級」功能,讓開發者可以根據任務的複雜度調整推理深度,從而在成本和準確度之間取得平衡。
「思考等級」功能允許開發者在四個推理深度(最低、低、中、高)之間動態調整,這對應用開發具有顯著影響。對於簡單任務,開發者可以選擇較低的推理深度,以降低延遲和成本;對於複雜任務,則可提高推理等級以確保準確度。這種彈性使得開發者能夠更有效地利用 AI 資源,並優化應用程序的性能和成本效益。此外,Gemini 3.1 Flash-Lite 支援文字、圖片、影片等多模態輸入,有助於開發更多元的應用。
儘管定位為輕量級模型,Gemini 3.1 Flash-Lite 在學術推理測試中表現出色,甚至超越了前幾代較大型的 Gemini 模型。其在 GPQA Diamond 基準測試中得分達到 86.9%,Arena.ai 排行榜 Elo 分數為 1432。Google 將其定位為「規模化智慧」的主力引擎,強調其在高頻、低複雜度的生產工作流中的應用潛力。VentureBeat 的評測認為,Gemini 3.1 系列的策略意圖是讓 Pro 模型負責「動腦」,而 Flash-Lite 負責「動手」,共同覆蓋企業 AI 基礎設施的全層需求。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容