什麼是機器學習中的「過擬合」？

機器學習中的「過擬合」是什麼？

在機器學習中，「過擬合」（Overfitting）是一種不理想的現象，指的是模型過於貼近訓練資料，學到的不只是資料中的規律，還包括了細節和雜訊，導致模型在訓練資料上表現良好，但在新的、未見過的資料上表現不佳。這就像學生只會死背考古題，遇到變化就無法應付。

過擬合的具體例子

以訓練 AI 模型辨識「狗」的圖像為例，如果訓練資料大多是狗在公園或戶外玩耍的照片，模型可能會學到「看到草皮 = 有狗」的錯誤關聯，導致無法辨識室內的狗。這種情況下，模型過度擬合了訓練資料的特定情境，而沒有學到狗的真正特徵。

過擬合與欠擬合的比較

與過擬合相對的概念是「欠擬合」（Underfitting），指的是模型過於簡化，無法捕捉資料中的規律，導致在訓練資料和新資料上都表現不佳。例如，如果模型只學到狗的粗略特徵，如「有四條腿、毛茸茸」，就無法分辨不同品種、環境下的狗，甚至連訓練集裡的狗也常常判錯。機器學習的目標就是在過擬合和欠擬合之間找到最佳平衡點，建立一個既能準確學習資料規律，又能有效泛化的模型。

什麼是機器學習中的「過擬合」？ | 數位時代

機器學習中的「過擬合」是什麼？

過擬合的具體例子

過擬合與欠擬合的比較