モデルを実装する際は、シンプルなことから始めます。ML における作業のほとんどはデータ 複雑なモデルでパイプライン全体を実行することは モデル自体の反復処理ですデータパイプラインを設定し いくつかの特徴を使用するシンプルなモデルを実装すれば より優れたモデルを作成することです。
単純なモデルは、最終的には起動しなくても、良いベースラインを与えてくれます。 実際、単純なモデルを使用する方が、想像するよりも良いでしょう。簡単に始められる 複雑なモデルが正当化されるかどうかを判断するのに役立ちます。
独自のモデルをトレーニングする(トレーニング済みモデルを使用する)
トレーニング済みモデルはさまざまなユースケースに対応しており、 説明します。ただし、トレーニング済みモデルが実際に機能するのは、 データセットと完全に一致しています。たとえば、トレーニング済みモデルが では 25 個の特徴量が使用され、データセットにはそのうちの 24 個しか含まれていない場合、 間違った予測を行う可能性が高くなります
一般に、ML 担当者は入力のサブセクションを照合して、 微調整や転移学習に使用することもできます。トレーニング済みモデルが 見つからない場合は、 サブセクションを使用して独自のモデルをトレーニングします。
トレーニング済みモデルについて詳しくは、以下をご覧ください。
モニタリング
問題のフレーミングを行う際には、モニタリングとアラートのインフラストラクチャについて、 ML ソリューションのニーズです
モデルのデプロイ
場合によっては、新しくトレーニングされたモデルが、 できます。存在する場合は、それが外部にリリースされないようにします。 自動デプロイが失敗したことを示すアラートが 届きます
トレーニング サービング スキュー
推論に使用される受信特徴のいずれかの値が、 分布範囲を表す場合は モデルの予測が不正確になる可能性が高いからですたとえば、 赤道都市の海面の気温を予測するようにトレーニングされたモデル 受信データに対して緯度 / 経度と緯度、 モデルがトレーニングされた範囲外の高度を推定します。 逆に、モデルで予測値が生成されている場合は、 分布範囲外のすべての予測が 説明します。
推論サーバー
RPC システムを使用して推論を行う場合は、 処理し、推論の提供を停止した場合、アラートを受け取ります。