Gemini 3 Pro在「人類終極考試」中獲得的頂尖成績,具體展現了其哪方面的能力?
Answer
Gemini 3 Pro 在「人類終極考試」中的頂尖成績所展現的能力
Gemini 3 Pro 在「人類終極考試」中獲得的頂尖成績,具體展現了其卓越的博士級(PhD Level)推理能力。這項考試被全球語言模型開發商視為檢驗 AI 模型性能的重要指標。Gemini 3 Pro 以 37.5% 的準確率高居 LMArena 排行榜首位,顯著超越了 Gemini 2.5 Pro 過去的 21.6% 成績。
Gemini 3 Pro 的關鍵能力:推理、簡潔與實用
除了在「人類終極考試」中的出色表現,Gemini 3 Pro 還展現了回應簡潔、直切重點的能力,摒棄了 AI 常見的陳腔濫調與恭維。Google 強調,Gemini 3 Pro 如同一位真正的思考夥伴,能以多種方式幫助使用者理解資訊與表達想法。例如,它可以因應論文內容生成 3D 視覺化的圖形,協助使用者更深入地了解所需內容。
Gemini 3 的應用與未來發展
Gemini 3 不僅在推理能力上有所突破,還在學習、打造和規劃等層面都更加強悍。例如,它可以分析匹克球比賽影片,指出動作修正要點並制定全面提升的訓練計畫。此外,Gemini 3 也能處理複雜的提示與指令,在衡量工程師代理人能力的 SWE-bench Verified 基準測試中,以 76.2% 的表現大幅超越 Gemini 2.5 Pro 版本。Google 也推出了 Gemini 3 Deep Think,在「人類終極考試」中獲得了 41% 的準確率,超越了 Gemini 3 Pro 的表現,未來將提供給 Google AI Ultra 的訂閱用戶使用。