什麼是機器學習中的「過擬合」? | 數位時代

機器學習中的「過擬合」是什麼?

在機器學習中,「過擬合」(Overfitting)是一種不理想的現象,指的是模型過於貼近訓練資料,學到的不只是資料中的規律,還包括了細節和雜訊,導致模型在訓練資料上表現良好,但在新的、未見過的資料上表現不佳。這就像學生只會死背考古題,遇到變化就無法應付。

過擬合的具體例子

以訓練 AI 模型辨識「狗」的圖像為例,如果訓練資料大多是狗在公園或戶外玩耍的照片,模型可能會學到「看到草皮 = 有狗」的錯誤關聯,導致無法辨識室內的狗。這種情況下,模型過度擬合了訓練資料的特定情境,而沒有學到狗的真正特徵。

過擬合與欠擬合的比較

與過擬合相對的概念是「欠擬合」(Underfitting),指的是模型過於簡化,無法捕捉資料中的規律,導致在訓練資料和新資料上都表現不佳。例如,如果模型只學到狗的粗略特徵,如「有四條腿、毛茸茸」,就無法分辨不同品種、環境下的狗,甚至連訓練集裡的狗也常常判錯。機器學習的目標就是在過擬合和欠擬合之間找到最佳平衡點,建立一個既能準確學習資料規律,又能有效泛化的模型。


This is a simplified version of the page. Some interactive features are only available in the full version.
本頁為精簡版,部分互動功能僅限完整版使用。
👉 View Full Version | 前往完整版內容