Ethan Mollick 提出的 AI 評估新維度是什麼? | 數位時代

Ethan Mollick 對 AI 評估的新維度:從智力到執行力

華頓商學院教授 Ethan Mollick 指出,隨著 AI 進入「代理時代」,評估 AI 的標準需要從過去著重於「智力」,轉向更關注其「執行力」。這表示我們不應僅僅關注 AI 的對話能力或知識儲備,更要評估它自主調用工具、執行複雜任務的能力。Mollick 強調,現在的 AI 已經進化為能夠自主行動的「代理人」,因此評估標準也應隨之調整。

AI 評估的三個維度

Mollick 提出,評估 AI 工具應從以下三個維度拆解:

  1. 模型 (Models):AI 的核心推理引擎,決定了邏輯運算、程式撰寫與數據分析的上限。目前市場上的三大模型包括 Gemini 3.1 Pro、GPT-5.2/5.3-Codex 與 Claude Opus 4.6。
  2. 應用程式 (Apps):使用者與模型互動的介面,包括網頁版和手機版 App。隨著 AI 工具朝向專業分工發展,出現了如 Claude Code(開發專用)或 Claude Cowork(桌上型代理)等新型 App。
  3. AI 工作套件 (Harnesses):讓模型能使用工具、規劃步驟、長時間自主執行任務的框架,是 AI 執行力的關鍵。例如,Claude 網站上的 Claude 配備了 AI 工作套件,使其能進行網路搜尋、編寫程式碼,並提供解決問題的指導。

從「效能稅」到選擇 AI 工具

Mollick 認為,專業工作者若要認真使用 AI,每月至少 20 美元(約 600 新台幣)的訂閱費是不可避免的,他稱之為「效能稅」。付費訂閱不僅能獲得更多的對話額度(token),還能享有任意切換模型和搶先使用最新版模型的權利。在選擇 AI 工具時,建議依照個人或企業的預算與工作流程深度,選擇最合適的訂閱方案。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容