閱讀紀錄

隱藏 →
此記錄會在頁面關閉後消失

xAI 聲稱 Grok 4.1 透過何種方法降低了幻覺率?

Answer

xAI 聲稱 Grok 4.1 降低幻覺率的方法

xAI 聲稱 Grok 4.1 透過「非推理模型+網路搜尋工具」的方式來降低幻覺率。具體來說,Grok 4.1 結合了一個不做深度推理的快速模型與網路搜尋工具來回答問題。接著,他們會逐一比對回答中每個可被查證的小事實(原子主張),檢查是否有重大或次要錯誤。最後,將各題的錯誤比例平均,得到幻覺率。xAI 表示,相較於前代模型,Grok 4.1 產生錯誤內容的機率下降至約三分之一。

Grok 4.1 的性能表現

根據 LMSYS Chatbot Arena 的最新排行榜,Grok 4.1 Thinking 以總分 1510 登上 Expert 榜首,Grok 4.1(一般版)則以 1437 分位居第 19。與兩個月前的 Grok 4 fast 相比,Grok 4.1 在對話穩定性、指令遵循與高難度提示詞等面向有明顯提升。Grok 4.1(thinking)在「高難度提示詞、編碼、指令執行、創意寫作」等類別表現亮眼。

Grok 4.1 的策略意涵

xAI 免費釋出 Grok 4.1 雙版本,旨在降低使用門檻,擴大用戶基礎。同時,透過付費方案減少頻率與容量限制,以維持商業化的可持續性。Grok 4.1 的核心賣點是降低幻覺和提升整體表現,而 Grok 4.1 Thinking 則展現更高階的推理與對話品質。然而,OpenAI 和 Google 等競爭對手也在不斷進步,使用者可以將 Grok 4.1 視為一個可靠性有所強化且基準成績優異的免費選項。

你想知道哪些?AI來解答

xAI 聲稱 Grok 4.1 透過何種獨特方法降低幻覺率?

more

Grok 4.1 在 LMSYS Chatbot Arena 的 Expert 榜單中取得了什麼樣的成績?

more

相較於前代 Grok 模型,Grok 4.1 在哪些關鍵面向有顯著的效能提升?

more

xAI 免費釋出 Grok 4.1 的策略,對其擴大用戶基礎有何潛在助益?

more

在 OpenAI 和 Google 等競爭對手持續進步的同時,Grok 4.1 如何定位自身的市場價值?

more

你覺得這篇文章有幫助嗎?

likelike
有幫助
unlikeunlike
沒幫助
reportreport
回報問題
view
1
like
0
unlike
0
分享給好友
line facebook link