閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

語言模型產生「幻覺」的主要原因是什麼?

Answer

語言模型產生「幻覺」的主要原因

OpenAI 的研究指出,語言模型產生「幻覺」(錯誤輸出)的主要原因在於,現行的訓練和評估機制鼓勵模型「猜測」,而非誠實地表達不確定性。目前主流的評估標準多採用二元計分,對於模型回答「不知道」或「不確定」的情況給予零分,這使得模型更傾向於猜測答案。

GPT-5-Thinking-Mini 在 SimpleQA 測試中的表現

在 GPT-5 系統卡的 SimpleQA 測試中,GPT-5-Thinking-Mini 的「棄權率」為 52%,而「錯誤率」為 26%。相較之下,較舊的 OpenAI o4-mini 模型的「棄權率」僅 1%,但「錯誤率」卻高達 75%。

數據分析與建議

這項數據顯示,GPT-5-Thinking-Mini 在不確定的情況下更傾向於選擇棄權,以此來降低錯誤率。研究建議修改目前主流的評估機制,明確納入「信心門檻」與錯誤懲罰,以減少 AI 幻覺並提升其可信度。

你想知道哪些?AI來解答

根據 OpenAI 的研究,語言模型產生「幻覺」的根本原因是什麼?

more

為何目前主流的 AI 評估標準會鼓勵模型「猜測」答案?

more

GPT-5-Thinking-Mini 在 SimpleQA 測試中的「棄權率」與「錯誤率」分別是多少?

more

與 GPT-5-Thinking-Mini 相比,舊款 OpenAI o4-mini 模型在 SimpleQA 測試中的表現有何差異?

more

研究建議如何修改 AI 評估機制以減少「幻覺」並提升可信度?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
1
like
0
unlike
0
分享給好友
line facebook link