xAI 聲稱 Grok 4.1 透過何種方法降低了幻覺率?
Answer
xAI 聲稱 Grok 4.1 降低幻覺率的方法
xAI 聲稱 Grok 4.1 透過「非推理模型+網路搜尋工具」的方式來降低幻覺率。具體來說,Grok 4.1 結合了一個不做深度推理的快速模型與網路搜尋工具來回答問題。接著,他們會逐一比對回答中每個可被查證的小事實(原子主張),檢查是否有重大或次要錯誤。最後,將各題的錯誤比例平均,得到幻覺率。xAI 表示,相較於前代模型,Grok 4.1 產生錯誤內容的機率下降至約三分之一。
Grok 4.1 的性能表現
根據 LMSYS Chatbot Arena 的最新排行榜,Grok 4.1 Thinking 以總分 1510 登上 Expert 榜首,Grok 4.1(一般版)則以 1437 分位居第 19。與兩個月前的 Grok 4 fast 相比,Grok 4.1 在對話穩定性、指令遵循與高難度提示詞等面向有明顯提升。Grok 4.1(thinking)在「高難度提示詞、編碼、指令執行、創意寫作」等類別表現亮眼。
Grok 4.1 的策略意涵
xAI 免費釋出 Grok 4.1 雙版本,旨在降低使用門檻,擴大用戶基礎。同時,透過付費方案減少頻率與容量限制,以維持商業化的可持續性。Grok 4.1 的核心賣點是降低幻覺和提升整體表現,而 Grok 4.1 Thinking 則展現更高階的推理與對話品質。然而,OpenAI 和 Google 等競爭對手也在不斷進步,使用者可以將 Grok 4.1 視為一個可靠性有所強化且基準成績優異的免費選項。