Anthropic 推出 Claude Opus 4.6,為何被稱為新一代頂尖「智能體」大模型? | 數位時代

Anthropic Claude Opus 4.6:新一代頂尖「智能體」大模型

Anthropic 推出了新一代旗艦模型 Claude Opus 4.6,這款模型在代理式程式開發、長上下文推理與網頁搜尋等關鍵評測中均表現領先,因此被譽為新一代頂尖「智能體」大模型。Opus 4.6 的推出不僅提升了在網路安全、財經法律、長文本檢索等專業領域的實戰能力,還首次將 Opus 等級模型的上下文視窗擴展至 100 萬 token。

Opus 4.6 的主要功能與特點

Opus 4.6 在多個方面都有顯著提升。在程式開發領域,它在代理式程式評測 Terminal-Bench 2.0 上取得領先成績,並在長程多工具搜尋測試 BrowseComp 中拿下最高分。此外,Opus 4.6 還支援 100 萬 token 上下文視窗,並搭配「上下文壓縮」機制,使其在長文本檢索評測 MRCR v2 中表現出色。同時,Anthropic 還強化了與辦公軟體的整合,包括升級 Claude in Excel 的長任務與多步驟資料處理能力,並推出 Claude in PowerPoint 的研究預覽版,能讀取版面配置、字型與母片設定,自動產出符合企業識別的簡報。

Anthropic 將 Claude 導入實際工作流程

Anthropic 持續將 Claude 導入實際工作流程,從法律外掛擴展到財務會計,並結合 Claude in Excel、PowerPoint 等辦公整合,以期在高附加價值的知識工作中發揮作用。例如,在法律領域,Claude 的外掛能協助使用者追蹤合規流程、審閱與分類合約與保密協議,並協助整理法律簡報與標記潛在風險。在財務領域,Opus 4.6 的金融資訊外掛能協助處理結帳、分錄、對帳、報表與差異分析等工作。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容