公平性: バイアスの種類

ML モデルは本質的に客観性のあるものではありません。ML 担当者 トレーニング サンプルのデータセットをモデルにフィードし、 データのプロビジョニングとキュレーションに関与することで、 バイアスの影響を受けやすい予測です

モデルを構築する際には、よくある人間のバイアスに注意し、 認識できるため、潜在的なリスクを緩和するための事前対策を講じることができます。 できます。

報告バイアス

歴史的バイアス

自動化バイアス

選択バイアス

選択バイアスは、 サンプルが、実際のデータセットを反映していない 学習します。選択バイアスにはさまざまな形態がありますが (対象範囲バイアス、無応答バイアス、サンプリング バイアスなど)です。

対象範囲のバイアス

非回答バイアス

サンプリング バイアス

グループ帰属バイアス

グループ帰属バイアス 個人に当てはまることをグループ全体に一般化して、 できます。グループ属性バイアスは、次の 2 つによく表れる フォームです。

所属グループのバイアス

自分が属していないグループに対する均一性のバイアス

暗黙的なバイアス

確証バイアス

テスト者のバイアス

演習:理解度をチェックする

次の種類のバイアスのうち、原因となっている可能性があるのはどれですか。 ある大学入学モデルにおける偏った予測に対する
歴史的バイアス
入学モデルは過去の学生記録でトレーニングされた 20 年になります。このデータでマイノリティの学生が過小評価されている場合 モデルは過去の同様の不平等を再現できた 予測するのに役立ちます
所属グループのバイアス
入学モデルは現役の大学生によってトレーニングされ、 無意識のうちに 入学を承諾したかったと 類似した背景から抽出され データのキュレート方法や特徴量エンジニアリングの方法に 基づいて取得されます。
確証バイアス
入学モデルは現役の大学生によってトレーニングされ、 どのような資格があるかを以前から信じていた可能性が高い回答者 コンピュータ サイエンス プログラムの成功と相関関係があります。攻撃者は 意図せずにデータをキュレートまたは特徴量エンジニアリングして モデルはこれらの既存の信念を正当化しました
自動化バイアス
自動化バイアスは、入学委員会が ML モデルを使用して入学許可を決定する攻撃者は、 自動化システムの方が 人間が行う決定です。ただし 自動化バイアスでは モデルの予測に偏りが生じた理由に関する分析情報などです