本番環境 ML システム: 静的トレーニングと動的トレーニング

大まかに言うと、次の 2 つの方法のいずれかでモデルをトレーニングできます。

  • 静的トレーニング( (オフライン トレーニング)と呼ばれるモデル)とは、 1 回だけです。その後、同じトレーニング済みモデルをしばらくサービングします。
  • 動的トレーニング( (オンライン トレーニング)と呼ばれる)では、モデルをトレーニングし、 向上させることができます通常は 新しいモデルを作成します。
図 2. 生地から同じパンが 3 つ作られます。
図 2.静的トレーニング。トレーニングを 1 回行う。同じ構築済みのモデルを 複数回失敗します。(画像提供: Pexels、fancycrave1)

 

図 3. 生の生地で作るパンは、パンの種類がわずかに異なる
            できます。
図 3. 動的トレーニング頻繁に再トレーニングする最大限に配信 構築します。(画像提供: Pexels、Couleur)

 

表 1. 主なメリットとデメリット。

静的トレーニング 動的トレーニング
メリット よりシンプルに。モデルの開発とテストが必要なのは 1 回だけです。 適応性が向上。モデルは需要の変化に対応して 特徴とラベルの関係の変化などです
デメリット 最新でない場合もあります特徴量とラベルの関係が 時間の経過とともに変化すると、モデルの予測は低下します。 手間がかかる。新しいプロダクトをビルド、テスト、リリースする必要がある 見てきました。

データセットが時間の経過とともに変化しない場合は、静的トレーニングを選択します。 動的トレーニングよりも作成と維持のコストが低くなりますしかしデータセットは たとえそのように思われる機能を持っていても 一定ではありません重要なポイント: 静的であっても、 入力データの変化をモニタリングする必要があります。

たとえば、ユーザーがインターネットからアクセスする確率を 花を買うでしょう。時間的な制約があるため、モデルのトレーニングは 7 月と 8 月の花の購入行動のデータセットを使用します。 数か月間は問題なく動作するモデルが、その後で予測がひどいものになる バレンタイン デー頃に 繁忙期のユーザー行動は劇的に変化します。

静的トレーニングと動的トレーニングについて詳しくは、このモジュールの ML プロジェクトの管理 説明します

演習:理解度をチェックする

次の記述のうち、正しいものを 2 つ選択してください。 静的(オフライン)トレーニング?
新しいデータを受信しても、モデルは最新の状態に保たれます。
実際、オフラインでトレーニングすると、モデルに 新しいデータを取り込みます。これがモデルの利用に 未更新であることを表します。 時間とともに変化します
本番環境に適用する前にモデルを検証できます。
はい。オフライン トレーニングではモデルを検証する十分な機会があります。 パフォーマンスを確認してから、本番環境にモデルを導入します。
オフライン トレーニングではトレーニング ジョブのモニタリングが少なくて済む 学習します
一般に、トレーニング時のモニタリング要件はそれほど大きくない オフライン トレーニングに最適であり、多くの本番環境から 留意してください。ただし モデルのトレーニングを頻繁に行うほど モニタリングに必要な投資額も高くなりますこれから コードに変更が加えられたことを検証するために、 (とその依存関係)がモデルの品質に悪影響を及ぼすことはありません。
入力データのモニタリングは、ほとんど必要ありません。 トレーニングされます。
直感に反して、サービング時に入力データをモニタリングする必要がある あります。入力分布が変化した場合、モデルの 予測が信頼できなくなる可能性があります。たとえば、1999 年から 2020 年までに 夏物の衣服のデータだけを使って 冬の衣料品購入行動を予測します
次の説明のうち、正しいものを1 つ選択してください。 動的(オンライン)トレーニング?
新しいデータを受信しても、モデルは最新の状態に保たれます。
これがオンライン トレーニングの主なメリットです。多くの脅威を 未更新の問題を未然に防ぐことができます。 表示されます。
トレーニング ジョブのモニタリングをほとんど必要としない。
実際には、トレーニング ジョブを継続的にモニタリングして、 正常な状態であり、意図したとおりに機能していることを確かめます。さらに、 モデルをロールバックする機能などのサポート インフラストラクチャ トレーニング中に問題が発生した場合に備えて 以前のスナップショットに復元できます たとえばバグのあるジョブや入力データの破損などです
入力データのモニタリングは、ほとんど必要ありません。 トレーニングされます。
静的なオフラインモデルと同様に 動的に更新されるモデルへの入力をモニタリングします。あなたは 大きな季節的影響のリスクはないでしょう 入力に大きな変更があった場合(アップストリームのデータソースが 予測の信頼性が低下する可能性があります。