Anthropic 推出的 Claude Opus 4.6 被譽為新一代頂尖「智能體」大模型,主要因為其在多項關鍵評測中表現領先。這些評測包括代理式程式開發、長上下文推理與網頁搜尋等領域。Opus 4.6 不僅提升了網路安全、財經法律、長文本檢索等專業領域的實戰能力,還首次將 Opus 等級模型的上下文視窗擴展至 100 萬 token。
Opus 4.6 在多個方面展現出顯著的提升。在程式開發領域,它在代理式程式評測 Terminal-Bench 2.0 上取得領先成績,並在長程多工具搜尋測試 BrowseComp 中拿下最高分。此外,Opus 4.6 支援 100 萬 token 上下文視窗,並搭配「上下文壓縮」機制,使其在長文本檢索評測 MRCR v2 中表現出色。Anthropic 還強化了與辦公軟體的整合,升級了 Claude in Excel 的長任務與多步驟資料處理能力,並推出了 Claude in PowerPoint 的研究預覽版,能讀取版面配置、字型與母片設定,自動產出符合企業識別的簡報。
Anthropic 持續將 Claude 導入實際工作流程,從法律外掛擴展到財務會計,並結合 Claude in Excel、PowerPoint 等辦公整合,以期在高附加價值的知識工作中發揮作用。在法律領域,Claude 的外掛能協助使用者追蹤合規流程、審閱與分類合約與保密協議,並協助整理法律簡報與標記潛在風險。在財務領域,Opus 4.6 的金融資訊外掛能協助處理結帳、分錄、對帳、報表與差異分析等工作。這使得 Claude Opus 4.6 在實際應用中展現出強大的潛力。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容