本番環境 ML システム: 静的トレーニングと動的トレーニング

モデルをトレーニングする方法は、大きく分けて次の 2 つです。

  • 静的トレーニングオフライン トレーニングとも呼ばれます)とは、モデルを 1 回だけトレーニングすることを意味します。その後、そのトレーニング済みモデルをしばらく提供します。
  • 動的トレーニングオンライン トレーニングとも呼ばれます)とは、モデルを継続的に、または少なくとも頻繁にトレーニングすることを意味します。通常は、最近トレーニングされたモデルを提供します。
図 2. 生地から 3 つの同じパンが作られます。
図 2.静的トレーニング。1 回トレーニングし、同じビルド済みモデルを複数回提供します。(画像: Pexels と fancycrave1 による)

 

図 3. 生地を捏ねるたびに、パンの形が少しずつ違ってきます。
図 3. 動的トレーニング。頻繁に再トレーニングし、最近作成したモデルを提供する。(画像: Pexels と Couleur による)

 

表 1. 主なメリットとデメリット。

静的トレーニング 動的トレーニング
メリット シンプル。モデルの開発とテストは 1 回だけ行う必要があります。 適応性が向上。モデルは、特徴量とラベルの関係の変化に対応します。
デメリット 古い場合もあります。特徴とラベルの関係が時間とともに変化すると、モデルの予測精度が低下します。 作業量が増える。新しいプロダクトの構築、テスト、リリースを常に行う必要があります。

データセットが時間の経過とともに変化しない場合は、動的トレーニングよりも作成と維持が安価な静的トレーニングを選択します。ただし、海面のように一定と思われる特徴を持つデータセットでも、時間の経過とともに変化する傾向があります。まとめ: 静的トレーニングでも、入力データに変更がないかモニタリングする必要があります。

たとえば、ユーザーが花を購入する確率を予測するようにトレーニングされたモデルについて考えてみましょう。時間的な制約があるため、モデルは 7 月と 8 月の花の購入行動のデータセットを使用して 1 回だけトレーニングされます。モデルは数か月間正常に動作しますが、バレンタイン デーの時期になると、花の贈り物に関するホリデー シーズン中のユーザー行動が大幅に変化するため、予測が大きく外れます。

静的トレーニングと動的トレーニングの詳細については、ML プロジェクトの管理コースをご覧ください。

演習: 理解度を確認する

静的(オフライン)トレーニングについて述べている次の記述のうち、正しいものを 2 つ選択してください。
新しいデータが到着すると、モデルは最新の状態に保たれます。
推論時に行う必要がある入力データのモニタリングはほとんどありません。
オフライン トレーニングでは、オンライン トレーニングよりもトレーニング ジョブのモニタリングが少なくなります。
モデルを本番環境に適用する前に確認できます。
動的(オンライン)トレーニングに関する次の記述のうち、正しいのはどれですか。
トレーニング ジョブのモニタリングはほとんど必要ありません。
推論時に入力データのモニタリングを行う必要はほとんどありません。
新しいデータが到着すると、モデルは最新の状態に保たれます。