實作模型

實作模型時,請先從簡單的開始。機器學習工作大部分的工作都在資料端進行,因此要為複雜的模型執行完整的管道會比進行疊代作業還要困難。設定資料管道並實作使用一些功能的簡易模型後,即可疊代建立更優質的模型。

即使最終並未啟動,簡單的模型也能提供良好的基準。事實上,使用簡單的模型可能會比您想像的好。從簡單的開始,可以幫助您判斷複雜的模型是否合理。

訓練自己的模型與使用預先訓練模型

許多預先訓練模型都適用於各種用途,並提供許多優點。然而,只有在標籤和特徵與資料集完全相符時,預先訓練模型才能發揮作用。舉例來說,如果預先訓練模型使用 25 個特徵,而您的資料集只包含 24 個特徵,預先訓練模型很可能會產生品質不佳的預測,

一般而言,機器學習從業人員會在預先訓練模型中比對輸入子區段,用於微調或遷移學習。如果預先訓練模型不存在適用於您的特定用途,建議您在訓練模型時,使用預先訓練模型的子區段。

如需預先訓練模型的相關資訊,請參閱

Monitoring

在問題取景期間,請考慮機器學習解決方案所需的監控及快訊基礎架構。

模型部署

在某些情況下,新訓練的模型可能比目前用於實際工作環境的模型更低。如果是的話,您當然希望避免這個版本發布至實際工作環境,並收到自動化部署作業失敗的快訊。

訓練/應用偏差

如果用於推論的任何傳入特徵的值超出訓練所用資料分佈範圍的值,您將會收到快訊通知,因為模型可能會導致預測品質不佳。舉例來說,如果您的模型經過訓練,可在海平面預測赤道城市的溫度,則提供系統應以經緯度及/或用來訓練模型的海拔高度提醒您傳入資料。相反地,如果模型進行的預測範圍超出訓練期間顯示的分佈範圍,服務系統應會通知您。

推論伺服器

如果您透過 RPC 系統提供推論,會想要監控遠端程序呼叫 (RPC) 伺服器本身,並在其停止提供推論時收到快訊。