xAI 聲稱 Grok 4.1 透過何種方法降低了幻覺率？

Answer

xAI 聲稱 Grok 4.1 降低幻覺率的方法

xAI 聲稱 Grok 4.1 透過「非推理模型＋網路搜尋工具」的方式來降低幻覺率。具體來說，Grok 4.1 結合了一個不做深度推理的快速模型與網路搜尋工具來回答問題。接著，他們會逐一比對回答中每個可被查證的小事實（原子主張），檢查是否有重大或次要錯誤。最後，將各題的錯誤比例平均，得到幻覺率。xAI 表示，相較於前代模型，Grok 4.1 產生錯誤內容的機率下降至約三分之一。

Grok 4.1 的性能表現

根據 LMSYS Chatbot Arena 的最新排行榜，Grok 4.1 Thinking 以總分 1510 登上 Expert 榜首，Grok 4.1（一般版）則以 1437 分位居第 19。與兩個月前的 Grok 4 fast 相比，Grok 4.1 在對話穩定性、指令遵循與高難度提示詞等面向有明顯提升。Grok 4.1（thinking）在「高難度提示詞、編碼、指令執行、創意寫作」等類別表現亮眼。

Grok 4.1 的策略意涵

xAI 免費釋出 Grok 4.1 雙版本，旨在降低使用門檻，擴大用戶基礎。同時，透過付費方案減少頻率與容量限制，以維持商業化的可持續性。Grok 4.1 的核心賣點是降低幻覺和提升整體表現，而 Grok 4.1 Thinking 則展現更高階的推理與對話品質。然而，OpenAI 和 Google 等競爭對手也在不斷進步，使用者可以將 Grok 4.1 視為一個可靠性有所強化且基準成績優異的免費選項。

觀看原始文章