Meta與牛津大學的研究中，AI僅透過文字學習便具備「視覺先驗」的兩大關鍵能力為何？

Meta與牛津大學研究：AI透過文字學習具備「視覺先驗」的兩大關鍵能力

Meta 超級智慧實驗室與牛津大學的科學家研究發現，僅透過閱讀文字學習的 AI，在未接觸視覺資訊前，便已具備理解視覺世界的潛力。此研究揭示了 AI 如何從文字中獲得「視覺先驗」，即「看東西的能力」。

「推理先驗」與「感知先驗」

AI 獲得「視覺先驗」的關鍵在於兩種學習成果。第一種是「推理先驗」，指的是 AI 透過閱讀高度結構化的文本（如程式碼、數學公式）所鍛鍊出的抽象思維框架，使其具備分析問題、建立因果關係的能力。第二種是「感知先驗」，指的是 AI 透過閱讀網路上廣泛的文本，潛移默化地將關於物體顏色、形狀等基礎知識儲存在心智資料庫中，如同人類腦中的「世界常識百科全書」。

AI學習的啟示

這項研究表明，AI 可以透過文字學習建構理解視覺世界的能力，如同人類學習般，掌握底層規律後便能觸類旁通。研究強調了建立思考能力的重要性，而非僅僅堆疊知識，並啟發我們重新思考對自身及下一代的學習方式。

Meta與牛津大學的研究中，AI僅透過文字學習便具備「視覺先驗」的兩大關鍵能力為何？ | 數位時代

Meta與牛津大學研究：AI透過文字學習具備「視覺先驗」的兩大關鍵能力

「推理先驗」與「感知先驗」

AI學習的啟示