Ethan Mollick 提出的 AI 評估新維度是什麼？

Ethan Mollick 對 AI 評估的新維度：從智力到執行力

華頓商學院教授 Ethan Mollick 指出，隨著 AI 進入「代理時代」，評估 AI 的標準需要從過去著重於「智力」，轉向更關注其「執行力」。這表示我們不應僅僅關注 AI 的對話能力或知識儲備，更要評估它自主調用工具、執行複雜任務的能力。Mollick 強調，現在的 AI 已經進化為能夠自主行動的「代理人」，因此評估標準也應隨之調整。

AI 評估的三個維度

Mollick 提出，評估 AI 工具應從以下三個維度拆解：

模型 (Models)：AI 的核心推理引擎，決定了邏輯運算、程式撰寫與數據分析的上限。目前市場上的三大模型包括 Gemini 3.1 Pro、GPT-5.2/5.3-Codex 與 Claude Opus 4.6。
應用程式 (Apps)：使用者與模型互動的介面，包括網頁版和手機版 App。隨著 AI 工具朝向專業分工發展，出現了如 Claude Code（開發專用）或 Claude Cowork（桌上型代理）等新型 App。
AI 工作套件 (Harnesses)：讓模型能使用工具、規劃步驟、長時間自主執行任務的框架，是 AI 執行力的關鍵。例如，Claude 網站上的 Claude 配備了 AI 工作套件，使其能進行網路搜尋、編寫程式碼，並提供解決問題的指導。

從「效能稅」到選擇 AI 工具

Mollick 認為，專業工作者若要認真使用 AI，每月至少 20 美元（約 600 新台幣）的訂閱費是不可避免的，他稱之為「效能稅」。付費訂閱不僅能獲得更多的對話額度（token），還能享有任意切換模型和搶先使用最新版模型的權利。在選擇 AI 工具時，建議依照個人或企業的預算與工作流程深度，選擇最合適的訂閱方案。

Ethan Mollick 提出的 AI 評估新維度是什麼？ | 數位時代

Ethan Mollick 對 AI 評估的新維度：從智力到執行力

AI 評估的三個維度

從「效能稅」到選擇 AI 工具