對機器學習模型進行偵錯,讓模型正常運作。模型運作後,您就能最佳化模型的品質,以用於實際工作環境。這個部分會說明偵錯和最佳化步驟。
機器學習偵錯功能有何不同?
在深入探索機器學習偵錯之前,讓我們先瞭解偵錯機器學習模型與一般程式偵錯有何差異。與一般程式不同,機器學習模型品質低落並不代表存在錯誤。相反地,為了在模型中偵錯效能低落,您要調查的因素比傳統程式設計更多。
舉例來說,以下是模型效能不佳的幾個原因:
- 功能缺少預測能力。
- 超參數已設為非最佳值。
- 資料包含錯誤和異常狀況。
- 特徵工程程式碼含有錯誤。
對機器學習模型進行偵錯的複雜度很高,疊代週期較長,且錯誤空間較大,因此偵錯機器學習模型並不容易。
機器學習模型開發程序
如果您遵循開發機器學習模型的最佳做法,就能簡化機器學習模型的偵錯作業。最佳做法如下:
- 從使用一或兩項功能的簡易模型著手。從簡單的簡單可偵錯模型開始,可協助您縮小導致模型效能低落的可能原因。
- 請嘗試不同的功能和超值以讓模型正常運作。請簡化模型,以簡化偵錯作業。
- 重複進行以下變更,以最佳化模型:
- 新增功能
- 調整超參數
- 提高模型容量
- 每次變更模型後,請重新檢查指標,並檢查模型品質是否增加。如果沒有,請按照本課程的說明偵錯模型。
- 疊代時,請慢慢逐漸增加模型的複雜度。