過度配適是指建立模型 相符 (「記憶」) 訓練集, 因此模型無法對新資料進行正確預測。 過度配適模型類似於在研究室中表現不錯,但 實際上是毫無意義的事
在圖 11 中,假設每個幾何形狀都代表樹狀結構的位置 所創造的科學成就藍色菱形代表健康樹木的位置 橘色圓圈則標示了病樹的位置。
練習畫出任何形狀 (線條、曲線、橢圓形等) 來區分 健康的樹木。然後展開下一行來檢視 其中一種可能的區隔
圖 12 所示的複雜形狀只成功分類,但其中兩個 樹木如果我們將這些形狀視為模型,就會發現 模型
還是這樣?非常優秀的模型成功分類新樣本。 圖 13 顯示該模型對新的預測 測試集的範例:
因此,圖 12 中顯示的複雜模型在訓練集上做得很好 但測試集的表現還不錯這是模型的典型案例 過度配適至訓練集資料。
貼合、過度配適和配適不足
模型必須對「新資料」做出良好的預測。 您的目標是建立一套「完美」的模型新的資料
如您所見,過度配適模型在訓練過程中做出極佳的預測 但新資料的預測結果不佳一個 低配適配模型 甚至針對訓練資料做出良好的預測如果過度調適模式 像是在研究室中表現不錯,但在現實生活中表現較差的產品 未成熟的模型就如同 這在研究室中會提到
一般化是指 與過度配適的情況也就是說,「一般化」模型對成效的助益 預測結果您的目標是建立 遠離新資料
偵測過度配適
以下曲線可協助您偵測過度配適:
- 損失曲線
- 一般化曲線
損失曲線會顯示模型的損失 與訓練疊代次數相比的結果 顯示兩條以上流失曲線的圖表稱為一般化 曲線。下列 一般化曲線顯示兩個損失曲線:
請注意,這兩條損失曲線最初的運作方式很相似,隨後不同。 也就是經過一定次數的疊代後 訓練集保持穩定 (對話),但增加 以供驗證集使用這表示過度配適。
相反地,完善擬合模型的通用化曲線則顯示兩條損失曲線 模型則會使用類似的形狀
造成過度配適的原因為何?
大致來說,過度配適是由以下一或兩種原因造成 問題:
- 訓練集對真實生活的資料 (或 驗證集或測試集)。
- 模型太複雜。
一般化條件
模型會以訓練集進行訓練,但真正測試的模型價值 因此能根據新的樣本做出預測,特別是在實際資料上。 開發模型時,測試集可做為實際資料的 Proxy。 訓練模型明確隱含下列資料集條件:
- 範例必須是 獨立且均勻分佈 清楚地說 這些範例無法相互影響
- 資料集是 「stationary」: 而且資料集不會隨時間大幅變動
- 資料集分區的分佈相同。 也就是說,訓練集中的範例在統計上類似於 驗證集、測試集和實際資料中的範例。
請透過下列練習探索上述條件。
練習:隨堂測驗
挑戰運動
您正在建立模型,用於預測乘客的理想購買日期 特定路線的火車票舉例來說,模型可能會建議 使用者購買了 7 月 8 日出發的火車票。 火車公司每小時會更新價格,並依據各式各樣的異動內容更新價格。 主要取決於目前空位數量也就是:
- 如果空位很多,票價通常會較低。
- 如果空位不多,票價通常會偏高。
答案:現實世界中的模型仰賴 意見回饋循環。
舉例來說,假設這個模型建議使用者在 7 月 8 日購票。 採用這個模型建議條件的部分乘客,將在 8:30 購票 早上 7 點到了 9:00,這家火車公司調高了股價,因為 現在開放較少席位。採用模型最佳化建議的乘客人數 價格變更。傍晚前,票價可能高出 早上