GPT‑5.1‑Codex‑Max 的「壓縮（compaction）」機制是如何運作的，以處理數百萬 tokens 的程式任務？

Answer

GPT-5.1-Codex-Max 的壓縮機制運作方式

GPT-5.1-Codex-Max 是 OpenAI 最新推出的代理型程式設計模型，其核心在於更新的推理底模與「壓縮（compaction）」機制。此機制允許模型在接近上下文極限時自動整理並保留關鍵脈絡，並在重啟新視窗後持續工作，進而在單一任務中連貫處理數百萬 tokens。這使得模型能夠原生跨越多個上下文視窗，支援長時間、細緻的工程任務，例如專案級重構、深度除錯與多小時代理迴圈。

壓縮機制的效能與成本優勢

OpenAI 表示，GPT-5.1-Codex-Max 在 SWE-bench Verified 等基準測試中，以 medium 推理強度相較前代 GPT-5.1-Codex（同強度）取得了更佳的表現，同時「思考 tokens 減少約 30%」，意味著推理更有效率，進而節省開發者的實際成本。相較於先前模型在面對龐大錯誤日誌或系統層級重構時容易耗盡情境窗的問題，Codex-Max 透過壓縮機制維持跨階段的上下文一致性，使其可以執行複雜的系統級重構（如全面搜尋、變更與修正跨參照）與長時程式工作負載。在同一任務中，Max 使用 27,000 tokens（對比非 Max 為 37,000），輸出 707 行程式碼（對比非 Max 為 864），速度提升了 27%。

安全性與 Windows 平台的強化

Codex-Max 預設執行環境採用安全沙箱（secure sandbox），檔案寫入被限制在指定工作目錄，並預設關閉網路，以降低長時推理的資安風險。此外，Codex-Max 也是 OpenAI 首個「為 Windows（視窗作業系統）有效運作而受訓的模型」，並在 Codex CLI 的協作任務上進行了優化。

觀看原始文章