Gemini 3 的推出，代表了 Google 在通用人工智慧（AGI）發展上的哪個關鍵躍進？

Answer

Gemini 3 代表 Google 在 AGI 發展上的關鍵躍進

Google Gemini 3 的推出，標誌著 Google 在通用人工智慧（AGI）發展上的一個重要里程碑。Google DeepMind 的執行長和技術長均表示，Gemini 3 的導入是他們在 AGI 道路上邁出的重要一步，並將其應用於包括 Gemini 3 Pro 聊天機器人、AI Mode 搜尋、Gemini App，以及開發者和企業端等全線產品。

Gemini 3 Pro 的卓越效能

Gemini 3 Pro 在所有 AI 基準測試中均顯著超越了 Gemini 2.5 Pro。其在 LMArena 排行榜上以 1501 分的成績位居首位，並在被譽為「人類終極考試」的測試中獲得了 37.5% 的準確率，遠勝於 Gemini 2.5 Pro 的 21.6%。此外，Google 還推出了 Gemini 3 Deep Think，在同一測試中取得了 41% 的準確率，進一步超越了 Gemini 3 Pro 的表現。這些數據表明 Gemini 3 在理解和解決複雜問題方面取得了顯著進展。

學習、打造和規劃能力的提升

Gemini 3 在學習、打造和規劃方面展現出更強大的能力。例如，學習者可以利用 Gemini 3 生成互動式記憶卡、視覺化圖表等輔助工具。在運動分析方面，Gemini 3 甚至可以分析匹克球比賽影片，指出動作修正要點，並制定全面的訓練計畫。對於開發者而言，Gemini 3 能夠處理複雜的提示與指令，在 SWE-bench Verified 基準測試中以 76.2% 的表現大幅超越 Gemini 2.5 Pro 版本。此外，Gemini 3 在 Vending-Bench 2 的評測中也位居榜首，證明其在整年模擬營運中能夠保持穩定的工具使用與決策品質，並在不偏離任務的前提下創造更高收益。這些功能上的提升顯示 Gemini 3 在實際應用中的多功能性和適應性。

觀看原始文章