Opus 4.5 在程式開發與代理工作流程方面，相較於前代模型有哪些具體突破？

Answer

Claude Opus 4.5 在程式開發與代理工作流程方面的突破

Anthropic 推出的 Claude Opus 4.5 定位為最強旗艦版本，在程式開發、代理（agentic workflows）與電腦使用方面具備領先能力。相較於前代模型，Opus 4.5 在多項真實世界工程測試表現出色，例如 SWE-bench 類型的評測，且在多語言與長程推理上有明顯進步。

效率與控制：Effort 參數

Opus 4.5 的核心變化之一是引入了「Effort 參數」，允許開發者在速度與成本以及能力最大化之間進行調整。官方數據顯示，在中等 Effort 下，Opus 4.5 可以用顯著更少的輸出 Token 達到與 Sonnet 4.5 相近或更好的分數；在最高 Effort 下，仍能以更少 Token 超越 Sonnet 4.5。同時，平台也強化了情境管理（Context Management）與記憶能力（Memory Capabilities），並支持多子代理協作，讓複雜多階段任務更可控、可組合。API 定價大幅下修至每百萬輸入代幣 5 美元、每百萬輸出代幣 25 美元，相較 Claude Opus 4.1 的 15 美元與 75 美元降幅約三分之二。

實際應用與能力提升

在實際應用中，Opus 4.5 在多家早期客戶測試中被評為「用更少 Token 完成更難任務」，包含 GitHub Copilot 等重度代理場景、跨程式碼庫重構、長時間自主編碼與長篇故事生成等使用情境。在典型業務場景的具體改善包括：Excel 自動化、金融建模和企業級多步任務。Opus 4.5 在長內容生成的穩定性更強，例如 10～15 頁章節，在段落結構、角色與設定的一致性更好；能維持主線邏輯與前後呼應，不易出現前後矛盾。

觀看原始文章