這項研究對我們重新思考 AI 和人類的學習方式,提出了哪些重要觀點?
Answer
研究揭示 AI 學習與人類學習的關聯性
Meta 超級智慧實驗室與牛津大學的科學家們的一項研究指出,透過大量文字學習的 AI,即使沒有視覺經驗,也能夠發展出理解視覺世界的能力。這項發現挑戰了我們對學習本質的理解,並引發了關於「讀萬卷書」與「行萬里路」何者更重要的深刻思考。這項研究不僅對 AI 領域有重要意義,也啟發我們重新評估人類的學習方式。
AI 如何從文字中獲得「視覺先驗」
這項研究揭示了 AI 從文字中獲得「視覺先驗」的兩種關鍵能力。首先是「推理先驗」,這是一種透過閱讀高度結構化的文本(如程式碼、數學公式)所鍛鍊出的抽象思維框架。其次是「感知先驗」,這是一種透過閱讀通用文本所建立的對具體事物的認知,類似於人類腦中的「世界常識百科全書」。這兩種能力共同構成了 AI 理解視覺世界的基础。
實驗設計與重要發現
研究團隊透過巧妙的實驗設計,將預訓練好的語言模型(LLM)的「文字大腦」凍結,然後外掛一個視覺編碼器,並訓練一個小小的「轉接器」來翻譯視覺資訊。實驗結果表明,「教材」的類型決定了學到的能力,主要閱讀程式碼和數學的 AI 模型在視覺問答任務上表現更佳。此外,研究還發現不同的學習內容存在不同的「效益曲線」,對於程式碼這類推理教材,AI 是多多益善,但對於描述顏色、形狀的常識教材,其學習效果會迅速飽和。
對人類學習的啟示
這項研究不僅為 AI 的發展提供了寶貴的啟示,也促使我們重新思考人類的學習方式。它印證了一個古老的教育哲學:學習的核心是建立思考的能力,而不僅僅是知識的堆疊。文字和圖像都只是複雜世界在不同媒介上的「投影」,掌握了底層規律的人或 AI,可以透過深入研究其中一種投影,反推出創造這些投影的那個「現實世界」的內在結構。