Gemini 3 的推出,代表了 Google 在通用人工智慧(AGI)發展上的哪個關鍵躍進?
Answer
Gemini 3 代表 Google 在 AGI 發展上的關鍵躍進
Google Gemini 3 的推出,標誌著 Google 在通用人工智慧(AGI)發展上的一個重要里程碑。Google DeepMind 的執行長和技術長均表示,Gemini 3 的導入是他們在 AGI 道路上邁出的重要一步,並將其應用於包括 Gemini 3 Pro 聊天機器人、AI Mode 搜尋、Gemini App,以及開發者和企業端等全線產品。
Gemini 3 Pro 的卓越效能
Gemini 3 Pro 在所有 AI 基準測試中均顯著超越了 Gemini 2.5 Pro。其在 LMArena 排行榜上以 1501 分的成績位居首位,並在被譽為「人類終極考試」的測試中獲得了 37.5% 的準確率,遠勝於 Gemini 2.5 Pro 的 21.6%。此外,Google 還推出了 Gemini 3 Deep Think,在同一測試中取得了 41% 的準確率,進一步超越了 Gemini 3 Pro 的表現。這些數據表明 Gemini 3 在理解和解決複雜問題方面取得了顯著進展。
學習、打造和規劃能力的提升
Gemini 3 在學習、打造和規劃方面展現出更強大的能力。例如,學習者可以利用 Gemini 3 生成互動式記憶卡、視覺化圖表等輔助工具。在運動分析方面,Gemini 3 甚至可以分析匹克球比賽影片,指出動作修正要點,並制定全面的訓練計畫。對於開發者而言,Gemini 3 能夠處理複雜的提示與指令,在 SWE-bench Verified 基準測試中以 76.2% 的表現大幅超越 Gemini 2.5 Pro 版本。此外,Gemini 3 在 Vending-Bench 2 的評測中也位居榜首,證明其在整年模擬營運中能夠保持穩定的工具使用與決策品質,並在不偏離任務的前提下創造更高收益。這些功能上的提升顯示 Gemini 3 在實際應用中的多功能性和適應性。