Anthropic 推出的 Claude Opus 4.5 定位為最強旗艦版本,在程式開發、代理(agentic workflows)與電腦使用方面具備領先能力。相較於前代模型,Opus 4.5 在多項真實世界工程測試表現出色,例如 SWE-bench 類型的評測,且在多語言與長程推理上有明顯進步。
Opus 4.5 的核心變化之一是引入了「Effort 參數」,允許開發者在速度與成本以及能力最大化之間進行調整。官方數據顯示,在中等 Effort 下,Opus 4.5 可以用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數;在最高 Effort 下,仍能以更少 Token 超越 Sonnet 4.5。同時,平台也強化了情境管理(Context Management)與記憶能力(Memory Capabilities),並支持多子代理協作,讓複雜多階段任務更可控、可組合。API 定價大幅下修至每百萬輸入代幣 5 美元、每百萬輸出代幣 25 美元,相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二。
在實際應用中,Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」,包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。在典型業務場景的具體改善包括:Excel 自動化、金融建模和企業級多步任務。Opus 4.5 在長內容生成的穩定性更強,例如 10~15 頁章節,在段落結構、角色與設定的一致性更好;能維持主線邏輯與前後呼應,不易出現前後矛盾。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容