Google AI Studio 的 A/B 測試,是在為 Gemini 3.0 Pro 進行何種關鍵能力的預先測試?
Answer
Google AI Studio的A/B測試:Gemini 3.0 Pro的關鍵能力預測
Google AI Studio 近期出現的 A/B 測試,被認為是 Gemini 3.0 Pro 在推出前的測試版本。這些測試主要針對兩項關鍵能力進行預先評估:手寫文本辨識的準確度,以及視覺結合推理的隱性符號化能力。藉由測試,Google 旨在提升 AI 在理解字面意義背後真實世界規則的能力。
突破手寫文本辨識的準確度
Gemini 3.0 Pro 的測試版本展現了將手寫文字辨識(HTR)提升到專家級準確度的潛力。在排除歧義標點與大小寫後,其字元錯誤率(CER)約為 0.56%,詞錯誤率(WER)約為 1.22%。這表示模型能更準確地辨識姓名、日期、金額、地名等關鍵資訊,這些資訊對於歷史研究和其他領域至關重要。
視覺結合推理的隱性符號化
除了準確辨識手寫文字,Gemini 3.0 Pro 還能在未被明確要求下,將視覺辨識與情境推理結合,進行近似「符號推理」的一致性校驗與換算。例如,在處理 1758 年的商人日記帳時,模型能自主判定「145」並非數字序列,而是重量的拆分,進而以價格倒推重量。這種能力使模型不僅能「抄對」字,還能連同上下文與世界規則「讀懂、驗算、自我更正」。
對各領域的潛在影響
Gemini 3.0 Pro 的這兩項關鍵能力,預計將對需要高精度「視覺+合規推理」的各領域產生重大影響。例如,在史料、帳冊、醫療、法務、製造現場等領域,AI 模型可從單純的轉錄進階到基於現實世界規則的上下文理解,從而確保資料的可信度。