GPT-5.2 模型在程式設計方面的優化主要體現在其結構化工作的處理能力上,其中 Thinking 版本更擅長程式設計。根據 OpenAI 的數據,GPT-5.2 在 SWE-Bench Pro 等業界基準測試中表現出色,顯示其在程式設計能力評估上名列前茅。這意味著該模型能夠更有效地處理複雜的程式設計問題,並提供更精準的解決方案。
GPT-5.2 在科學推理方面也進行了優化,同樣在研究生級科學推理基準 GPQA Diamond 上獲得了優異的成績。這表明該模型在處理科學研究相關的複雜問題時,能夠提供更深入、更精確的分析和解答。Pro 版本旨在為複雜問題提供最精準的解答,這也暗示了其在科學任務上的優勢。
GPT-5.2 模型在一般工作任務上的優化體現在多個方面。Instant 版本在寫作和資訊搜尋方面速度更快,有助於提高工作效率。在 GDPval 評估中,GPT-5.2 在 70.9% 的明確任務上擊敗或追平了業界頂尖專業人士,這顯示其在解決複雜問題和執行專業任務方面具有卓越的能力。此外,OpenAI 還推出了可預測使用者年齡的軟體,以更好地管理 ChatGPT 對 18 歲以下使用者的回應,並計劃在明年第一季推出「成人模式」,允許為經過驗證的成人提供特定內容,這些舉措顯示 OpenAI 在不斷擴展模型應用範圍的同時,也注重安全性和使用者體驗。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容