本番環境 ML システム: 質問

このレッスンでは、本番環境システムのデータとモデルについて確認すべき質問について説明します。

各機能は役に立ちましたか?

モデルを継続的にモニタリングして、モデルの予測能力にほとんどまたはまったく貢献しない特徴を削除する必要があります。その特徴の入力データが急激に変化すると、モデルの動作も望ましくない方法で急激に変化する可能性があります。

以下の関連する質問も検討してください。

  • 機能の有用性が、その機能の追加にかかる費用を正当化するものですか?

モデルに機能を追加したくなるのは当然です。たとえば、追加することでモデルの予測がわずかに改善される新しい特徴を見つけたとします。予測の精度が少し向上することは、精度が少し低下するよりも確かに良いことですが、追加機能はメンテナンスの負担を増やします。

データソースは信頼できますか?

入力データの信頼性について確認すべき点は次のとおりです。

  • シグナルは常に利用可能か、信頼できないソースから取得されるか。例:
    • シグナルは、負荷が高いときにクラッシュするサーバーから送信されていますか?
    • 8 月に休暇を取る人間から発信されたシグナルですか?
  • モデルの入力データを計算するシステムは変更されますか?該当する場合:
    • どのくらいの頻度で発生しますか?
    • そのシステムが変更されたことをどのようにして知ることができますか?

アップストリーム プロセスから受信したデータのコピーを独自に作成することを検討してください。安全にアップストリーム データの次のバージョンに進む場合は、そのことを確認してください。

モデルはフィードバック ループの一部ですか?

モデルが独自のトレーニング データに影響することもあります。たとえば、一部のモデルの結果は、その同じモデルへの入力特徴(直接的または間接的)になります。

モデルが別のモデルに影響を与えることもあります。たとえば、株価を予測する 2 つのモデルについて考えてみましょう。

  • モデル A: 不適切な予測モデル。
  • モデル B。

モデル A にはバグがあるため、誤って Stock X の株式を購入することにします。これらの購入により、株式 X の価格が上昇します。モデル B は、株式 X の価格を入力特徴として使用するため、株式 X の価値について誤った結論に至る可能性があります。したがって、モデル B は、モデル A のバグのある動作に基づいて、株式 X の株を売買する可能性があります。モデル B の動作がモデル A に影響し、チューリップ マニアや会社 X の株価の下落を引き起こす可能性があります。

演習: 理解度を確認する

次のモデルのうち、フィードバック ループの影響を受けやすいのは3 つです。
海水浴場の混雑度を特徴の一つとして使用し、海水浴場近辺の高速道路出口での渋滞を予測する交通予測モデル。
海水浴客の中には交通予測に基づいて計画を立てる人もいます。海水浴場の人出が多く、交通量が多くなると予測される場合、多くの人が計画を変更する可能性があります。その結果、海水浴場への人出が抑えられて予測される交通量が減り、それを受けて人出が増えるといったサイクルが繰り返されます。
書籍の人気度(つまり本が購入された回数)に基づいて、ユーザーが好みそうな小説を提案する書籍推薦モデル。
書籍の推奨により購買が促進される可能性が高く、これらの追加の販売が入力としてモデルにフィードバックされ、モデルによって将来同じ書籍が推奨される可能性が高くなります。
学校を格付けする基準の一つとして選択性(出願した学生のうち、入学を許可された学生の割合)を使用する大学ランキング モデル。
このモデルのランキングによって上位の学校への関心がさらに高まり、出願数が増える可能性があります。入学を許可される学生の数が同じまま保たれると選択性が高まり(合格者の割合が低下し)ます。その結果、これらの学校のランキングが上がり、受験生の関心がさらに高まります。
投票終了後に投票者の 2% を調査することで市長選挙の当選者を予測する選挙結果モデル。
投票が締め切られるまでにモデルが予測を公開しなければ、予測が投票者の行動に影響を及ぼす可能性はありません。
広さ(平方メートル単位の面積)、寝室数、地理的位置を特徴として使用して住宅の価格を予測する住宅価格モデル。
住宅の場所、広さ、寝室数が価格予想を反映してすぐに変化することはないため、フィードバック ループの可能性は低くなります。ただし、広さと寝室数の間に潜在的な相関関係がある(家が広くなれば部屋数が増える傾向がある)ため、分離して分析する必要があります。
写真の中の人がほほ笑んでいるかどうかを検出する顔属性モデル。毎月自動的に更新されるストックフォトのデータベースで定期的にトレーニングを行います。
モデルの予測は写真データベースに影響を与えないため、ここにはフィードバック ループはありません。ただし、この場合は、毎月の更新が想定外の影響をモデルに及ぼす潜在的な可能性があるため、入力データのバージョニングが重要になります。