OpenAI 在推出 GPT-5.4 後,發布了一份提示工程指南,強調了在 AI 產品開發中,清晰的提示詞設計比單純依賴算力提升更為重要。過去,開發者傾向於透過升級模型或提高推理設定來解決 AI 回應不佳的問題。然而,OpenAI 指出,提高算力只是微調的最後手段,並非萬能解方。多數情況下,透過清晰、明確的提示詞,能更有效地提升 AI 的效能。
GPT-5.4 具備五個推理力道層級:none、low、medium、high 和 xhigh。許多使用者習慣將推理運算量設定為最高,以尋求更全面的回應,但這往往會增加時間延遲與成本。OpenAI 建議,除非是需要最高智能且能接受速度與成本代價的長程 Agent 任務,否則應避免預設使用 xhigh。大多數開發團隊應在 none 到 medium 的範圍內進行調整。使用 ChatGPT 前,應先檢查是否提供 AI 完整的合約與驗證機制,並從零開始測試,針對一般資料提取、客服分類或短格式轉換等任務,從 none 或 low 層級開始設定。只有在處理跨文件比對、深度研究或解決複雜衝突等需要高度邏輯的情境時,才應考慮將推理層級調升至 medium 或以上。
OpenAI 建議開發者採用嚴謹的工程化指令,取代模糊的對話,以提升 AI 的效能。這包括三個步驟:首先,建立輸出合約(Output Contract),明確規定輸出的格式、字數限制與特定步驟,以達到最佳的 token 效率。其次,強制驗證迴圈(Verification Loop),在 AI 執行發送、修改或刪除等高風險操作前,加入自我檢查機制,確認事實根據與格式無誤後才能放行。最後,增加工具持續規則(Tool Persistence Rules),確保模型持續使用工具,直到任務真正完成且通過驗證迴圈檢查,以提升正確性或完整性。加入這三個結構化提示塊後,如果問題依然存在,再來考慮提高推理層級。
GPT-5.4 在多工具協作場景有所提升,但模型仍容易犯三個失誤。第一,AI 時常跳過前置步驟,解決方案是加入「依賴檢查機制」(Dependency Checks),強制確認前置作業已完成。第二,回答跑一半就自行收工,解決方案是訂立「完成合約」(Completeness Contract),讓模型維護一份內部清單,項目只能標記為完成或無法完成。第三,查不到資料就自行放棄,解決方案是導入「空結果恢復機制」(Empty Result Recovery),強制模型在放棄前至少嘗試一到兩個替代查詢策略。
This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容