實際工作環境機器學習系統:靜態與動態訓練

一般來說,您可以透過下列兩種方式訓練模型:

  • 靜態訓練 (也稱為離線訓練) 是指您只訓練一次模型。然後提供同一個經過訓練的模型一段時間。
  • 動態訓練 (也稱為線上訓練) 是指持續或至少經常訓練模型。您通常會提供最近訓練的模型。
圖 2:原料麵團可製作三個相同的麵包。
圖 2. 靜態訓練。訓練一次,多次提供相同的已建構模型。(圖片來源:Pexels 和 fancycrave1)。

 

圖 3. 每次使用生麵團製作麵包時,麵包的形狀都會有些微差異。
圖 3. 動態訓練。經常重新訓練,提供最近建構的模型。(圖片來源:Pexels 和 Couleur)

 

表 1. 主要優缺點。

靜態訓練 動態訓練
優點 更簡單。您只需要開發及測試模型一次。 更具彈性模型會持續追蹤特徵和標籤之間的關係變化。
缺點 有時會較為過時。如果特徵和標籤之間的關係隨時間變化,模型的預測結果就會變差。 工作量增加。您必須持續建構、測試及發布新產品。

如果資料集確實不會隨時間變化,請選擇靜態訓練,因為建立和維護靜態訓練的成本比動態訓練低。不過,資料集通常會隨時間變化,即使是您認為恆定不變的資料集 (例如海平面) 也是如此。結論:即使使用靜態訓練,您仍必須監控輸入資料是否有變動。

舉例來說,假設您訓練的模型要預測使用者購買花束的機率。由於時間緊迫,因此模型只使用 7 月和 8 月的花卉購買行為資料集訓練一次。這個模型在幾個月內運作良好,但在情人節期間,由於使用者行為出現大幅變化,因此預測結果不準確。

如要進一步瞭解靜態和動態訓練,請參閱管理機器學習專案課程。

練習:測試您的理解程度

下列哪兩項關於靜態 (離線) 訓練的敘述正確無誤?
在推論期間,您只需監控少量輸入資料。
相較於線上訓練,離線訓練對訓練工作的監控需求較低。
您可以在正式工作環境中套用模型前先驗證模型。
模型會在收到新資料時保持最新狀態。
以下哪個敘述與動態 (線上) 訓練相關?
模型會在收到新資料時保持最新狀態。
在推論期間,您只需監控少量輸入資料。
您只需監控訓練工作,