AI 學習的「推理先驗」與「感知先驗」究竟是什麼?
Answer
AI 學習中的「推理先驗」與「感知先驗」解析
Meta 與牛津大學的研究揭示,AI 即使僅透過文字學習,也能培養理解視覺世界的能力。AI 從文字中習得「視覺先驗」的途徑,主要由兩種學習成果構成,分別是「推理先驗」與「感知先驗」。這兩種先驗是 AI 理解和模擬視覺世界的基礎。
推理先驗 (Reasoning Prior) 的定義與作用
「推理先驗」是指 AI 透過閱讀程式碼、數學公式、學術論文等高度結構化的文本,所鍛鍊出的邏輯分析能力。這種能力讓 AI 能夠分析問題、建立因果關係,並洞察模式。具備強大推理先驗的 AI,在處理需要抽象思考的視覺問答任務時表現更為出色,因為它能從結構化的資訊中提取邏輯關係,並應用於視覺資訊的理解。
感知先驗 (Perception Prior) 的定義與作用
「感知先驗」是指 AI 透過閱讀網路上包羅萬象的通用文本,逐步建立起關於物體顏色、形狀、名稱等基礎知識的心智資料庫。這種先驗讓 AI 能夠理解和識別視覺世界中的基本元素。儘管感知先驗的學習效果會隨著資料量的增加而趨於飽和,但它仍然是 AI 理解視覺世界不可或缺的基礎。
學習內容對 AI 能力的影響
研究顯示,AI 學習的內容類型會直接影響其學習能力。例如,透過程式碼和數學學習的 AI 模型,在需要抽象思考的視覺問答任務上表現較好。此外,不同類型的學習內容存在不同的效益曲線。對於能鍛鍊思維的「推理教材」,AI 學習越多越好,但對於描述顏色、形狀的「常識教材」,其學習效果會迅速飽和。這提醒我們,在設計 AI 學習內容時,應側重於培養其底層的思考能力,而不僅僅是知識的堆疊。