分類: 予測バイアス

第 2 部の 線形回帰 モジュール、計算 予測バイアス モデルやトレーニング データの問題にフラグを立てることができるクイック チェックである 考えなければなりません

予測バイアスとは、モデルの平均と予測結果の差です。 予測 と、 ラベルのグラウンド トゥルース ラベル 分析できますデータセットでトレーニングされたモデル 5%の E メールが迷惑メールだと 予測すると 迷惑メールに分類されます。つまり、ラベル内のラベルの平均を グラウンド トゥルース データセットは 0.05、モデルの予測の平均は 0.05 にします。この場合、モデルの予測バイアスはゼロになります。/ モデルには他の問題が残っている可能性があります。

メールが迷惑メールである確率が 50% になるとモデルが予測した場合、 新しいデータセットに問題がある場合、 モデル自体に関係します制限なし 2 つの平均値の有意差がある場合、モデルは ある程度予測できます

予測バイアスは、次のような原因で発生する可能性があります。

  • データ内のバイアスまたはノイズ(トレーニング セットのバイアスのあるサンプリングを含む)
  • 正則化が強すぎる。つまり、モデルが過度に簡略化されて失われた ある程度の複雑さを
  • モデル トレーニング パイプラインのバグ
  • モデルに提供された一連の特徴がタスクに不十分である
で確認できます。