Gemini 3 Deep Think在「人類終極考試」中的表現,與Gemini 3 Pro相比有何差異?
Answer
Gemini 3 Deep Think 與 Gemini 3 Pro 在「人類終極考試」中的差異
根據 Google 的資料,Gemini 3 在 2025 年 11 月 19 日正式推出,並導入全線產品。其中,Gemini 3 Pro 在所有 AI 基準測試中均顯著超越 Gemini 2.5 Pro,在「人類終極考試」中獲得 37.5% 的準確率,高居 LMArena 排行榜首位。
Gemini 3 Deep Think 是 Google 推出的另一版本,將優先開放給測試人員使用,之後才會提供給 Google AI Ultra 的訂閱用戶。在「人類終極考試」中,Gemini 3 Deep Think 獲得了 41% 的準確率,超越了 Gemini 3 Pro 的表現。
Gemini 3 的應用
Gemini 3 在學習、打造和規劃方面都更加強悍。例如,學習者可以輸入學術論文、長篇教學影片或講義,Gemini 3 就能生成互動式記憶卡、視覺化圖表等輔助工具。在 AI Mode 中,Gemini 3 可以直接生成專屬的貸款計算器,方便使用者比較方案。對於開發者,Gemini 3 也能處理複雜的提示與指令,在 SWE-bench Verified 基準測試中表現大幅超越 Gemini 2.5 Pro 版本。此外,Gemini 3 在 Vending-Bench 2 的評測中位居榜首,顯示其在長期規劃能力上的優勢。