楊立昆的世界模型架構與傳統 LLM 的學習方式有何不同?
Answer
楊立昆的世界模型與傳統 LLM 的學習方式差異
楊立昆(Yann LeCun)認為,傳統大型語言模型(LLM)主要透過分析大量文本資料來學習語言模式,但缺乏對物理世界的真正理解,使其在處理需要常識推理和預測的任務時表現不佳。他因此批評 LLM「比貓還笨」,因為 LLM 無法像人類或動物一樣,通過感知和互動來理解現實世界的運作方式,這使得 LLM 難以實現通用人工智慧。
世界模型的獨特架構與學習方式
楊立昆提倡的「世界模型」旨在使機器能夠理解和預測物理世界的運作方式。這種 AI 架構的核心是讓 AI 系統從視覺和空間數據中學習內在的因果關係,並以此建立對未來狀態的預測能力。世界模型賦予 AI 系統「想像」未來情景的能力,使其能夠基於對世界的理解來規劃和執行行動。與 LLM 僅依賴文本數據不同,世界模型更注重從多模態數據中學習,以建立更全面的世界理解。
Meta AI 發展路線的分歧
楊立昆與 Meta 在 AI 發展路線上的分歧也是他批評 LLM 的背景因素。Meta 執行長祖克柏將 LLM 視為實現超級智慧的核心路徑,並投入大量資源進行相關研究。然而,楊立昆堅信世界模型才是 AI 的未來,這種根本性的分歧導致他在 Meta 的影響力逐漸減弱。Meta 近期的人事變動,例如聘請 Scale AI 創辦人汪滔領導新的 AI 團隊,以及對基礎 AI 研究團隊(FAIR)的資源削減,更凸顯了 Meta 在 AI 發展策略上的轉變。