Meta與牛津大學的研究中,AI僅透過文字學習便具備「視覺先驗」的兩大關鍵能力為何? | 數位時代

Meta與牛津大學研究:AI透過文字學習具備「視覺先驗」的兩大關鍵能力

Meta 超級智慧實驗室與牛津大學的科學家研究發現,僅透過閱讀文字學習的 AI,在未接觸視覺資訊前,便已具備理解視覺世界的潛力。此研究揭示了 AI 如何從文字中獲得「視覺先驗」,即「看東西的能力」。

「推理先驗」與「感知先驗」

AI 獲得「視覺先驗」的關鍵在於兩種學習成果。第一種是「推理先驗」,指的是 AI 透過閱讀高度結構化的文本(如程式碼、數學公式)所鍛鍊出的抽象思維框架,使其具備分析問題、建立因果關係的能力。第二種是「感知先驗」,指的是 AI 透過閱讀網路上廣泛的文本,潛移默化地將關於物體顏色、形狀等基礎知識儲存在心智資料庫中,如同人類腦中的「世界常識百科全書」。

AI學習的啟示

這項研究表明,AI 可以透過文字學習建構理解視覺世界的能力,如同人類學習般,掌握底層規律後便能觸類旁通。研究強調了建立思考能力的重要性,而非僅僅堆疊知識,並啟發我們重新思考對自身及下一代的學習方式。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容