Anthropic 最新推出的 Claude Opus 4.5 強調其在程式開發和代理工作流程上的卓越能力,定位為最強旗艦版本。相較於前代模型,Opus 4.5 在真實世界的工程測試中表現更為出色,例如 SWE-bench 類型的評測,並在多語言和長程推理能力方面有所提升。
Opus 4.5 的一個重要創新是引入了 "Effort 參數",這讓開發者可以根據需求調整速度、成本和能力。官方數據顯示,在中等 Effort 下,Opus 4.5 可以使用更少的輸出 Token,達到與 Sonnet 4.5 相近甚至更好的效果。在最高 Effort 下,它仍然能夠以更少的 Token 超越 Sonnet 4.5。此外,平台還強化了情境管理和記憶能力,並支持多子代理協作,使得複雜的多階段任務更可控、可組合。API 定價也大幅下調,輸入代幣降至每百萬 5 美元,輸出代幣降至每百萬 25 美元,相較於 Claude Opus 4.1 的 15 美元和 75 美元,降幅約為三分之二。
在實際應用中,Opus 4.5 在早期客戶測試中被譽為 "用更少的 Token 完成更難的任務"。它適用於 GitHub Copilot 等重度代理場景,以及跨程式碼庫重構、長時間自主編碼和長篇故事生成等情境。在典型的業務場景中,Opus 4.5 能夠顯著改善 Excel 自動化、金融建模和企業級多步任務。此外,Opus 4.5 在長內容生成的穩定性上有所提升,例如 10~15 頁章節,在段落結構、角色和設定的一致性上表現更好,能夠維持主線邏輯和前後呼應,減少出現前後矛盾的情況。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容