實際工作環境機器學習系統:靜態與動態訓練

廣義來說,您可以透過下列任一方式訓練模型:

  • 靜態訓練 (以及 稱為「離線訓練」) 一次。您接著提供相同的訓練模型一段時間。
  • 動態訓練 (以及 稱為「線上訓練」) 意味著您訓練模型 持續不斷或至少頻繁更新您通常最多放送 最近訓練過的模型
,瞭解如何調查及移除這項存取權。
圖 2:生麵糰製作三個相同的麵包。
圖 2.靜態訓練。訓練一次;都能提供 以便重複使用(圖片由 Pexels 提供,作者為 FreRNrave1)。

 

圖 3. 生麵團的麵包稍有不同
            讀取。
圖 3. 動態訓練。經常重新訓練服務最多 最近建構的模型(圖片由 Pexels 和 Couleur 提供)。

 

表 1. 主要優缺點

靜態訓練 動態訓練
優點 更簡單您只需要開發並測試模型一次即可。 更靈活彈性模型與時俱進 功能變更。
缺點 有時會導致進度落後。如果特徵和 隨著標籤出現變化,模型的預測結果就會降低。 更多工作。您必須建構、測試及發布新產品 而且數量仍在持續增加

如果資料集真的不會隨時間變化,請選擇靜態訓練,因為 建立和維護的費用比動態訓練便宜不過,資料集 日新月異,即使你認為功能 例如海平面要點:即使是靜態資料 您仍須監控輸入資料的變化

舉例來說,假設某個經過訓練的模型 將會預測使用者 他們最願意花錢買花因為時間壓力,模型只訓練一次 。 這個模型可以運作數個月,但之後做出了不穩定的預測結果 情人節前後幾天,因為 在這段期間,使用者行為會大幅改變。

如需更詳細的靜態和動態訓練探索,請參閱 管理機器學習專案 稍後您會在 BigQueryML AutoML 和自訂訓練中使用這些模型

練習:隨堂測驗

下列兩項敘述的敘述何者正確 靜態 (離線) 訓練?
並在收到新資料時持續更新模型。
請注意,如果您是離線訓練,模型就無法 並在收到新資料時加以整合這會導致 或過時等情形 隨時產生變更
在正式環境中套用模型前,您可以進行驗證。
是,離線訓練能夠提供大量驗證模型的機會 ,接著才將模型導入正式環境。
如要進行離線訓練,可以減少對訓練工作的監控程度 而非線上訓練
一般來說,在訓練期間的監控需求比較適中 進行離線訓練,從 考量重點不過,越常訓練模型 您增加監控的投資金額您 也想定期驗證 確保程式碼有所變更 (及其依附元件) 不會對模型品質造成負面影響。
只有在以下位置才會對輸入資料進行極少監控 自動推論時間
相反地,您需要在提供服務時監控輸入資料 讓應用程式從可以最快做出回應的位置 回應使用者要求如果輸入分佈發生變化,就會 可能使預測結果不穩定假設 只使用夏季服飾資料進行訓練 以預測冬季服飾的購買行為
下列「一項」敘述何者正確 動態 (線上) 訓練?
並在收到新資料時持續更新模型。
這是線上訓練課程的主要優點;就能避免 過時程度問題,方法是讓模型根據新資料進行訓練, 之後出現時的情況
幾乎不需要監控訓練工作。
事實上,您必須持續監控訓練工作,以確保 健康狀態良好且正常運作另請準備 支援基礎架構,例如復原模型 新增到先前的快照,以防訓練作業出錯 例如錯誤工作或輸入資料毀損。
只有在以下位置才會對輸入資料進行極少監控 自動推論時間
如同靜態的離線模型 監控動態更新模型的輸入內容你正在 不太可能受重大季節性影響 輸入內容的重大變更 (例如上游資料來源 可能導致預測結果不準確。