機械学習(ML)モデルは本質的に客観性のあるものではありません。ML 担当者は、トレーニング サンプルのデータセットをモデルにフィードすることでモデルをトレーニングします。このデータのプロビジョニングとキュレーションに人間が関与すると、モデルの予測はバイアスの影響を受けやすくなります。
モデルを構築する際には、よくある人間のバイアスに注意し、 認識できるため、潜在的なリスクを緩和するための事前対策を講じることができます。 できます。
報告バイアス
-
定義
報告バイアスは イベント、プロパティ、結果をキャプチャしても、 正確に反映させることができますこのバイアスは、人は通常の状況については記録する必要がないと考え、いつもとは異なる状況や、特に記憶に残る状況を文書化することを重点とする傾向があるため生じる可能性があります。
-
例
書籍が書籍かどうかを予測するようにトレーニングされた感情分析モデル ユーザーのコーパスに基づくレビューが肯定的か否定的か 人気ウェブサイトでの応募件数などですレビューの大半は、 極端な意見( (本を好き、嫌いなど) 強い反応がなかった場合の書籍のレビューたとえば、 モデルは、感情スコアを正確に予測できず、 本を説明するのに繊細な表現を使うレビュー。
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
歴史的バイアス
-
定義
歴史的バイアスは、過去のデータに当時の世界に存在した不平等が反映されている場合に発生します。
-
例
1960 年代のデータセットを収容する都市に住宅価格データが含まれる <ph type="x-smartling-placeholder"></ph>を反映 差別的な融資慣行が適用されることを願っています。 あります。
定義の chevron_left をクリックします。
自動化バイアス
-
定義
自動化バイアスとは、結果を優先する傾向を指します。 自動化されたシステムによって生成されたものよりも 各システムのエラー率とは関係ありません
-
例
歯車メーカーで働く ML 担当者は、歯の欠陥を特定するためにトレーニングした新しい「画期的な」モデルをデプロイしようとしていましたが、工場監督者がモデルの精度と再現率が人間の検査員のそれよりも 15% 低いことを指摘しました。
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
選択バイアス
選択バイアスは、 サンプルが、実際のデータセットを反映していない 学習します。選択バイアスにはさまざまな形態がありますが (対象範囲バイアス、無応答バイアス、サンプリング バイアスなど)です。
対象範囲のバイアス
-
定義
カバレッジ バイアスは、 提示します
-
例
モデルは、新しい商品の将来の売上を予測するようにトレーニングされます。 買い物をした消費者のサンプルを対象として電話で実施したアンケート 説明します。競合他社の製品を購入した消費者は調査対象外だったため、このグループはトレーニング データに含まれていません。
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
無回答のバイアス
-
定義
非回答バイアス(別名 (参加バイアスなど)が データ収集における参加機会のギャップにより、代表性に欠ける プロセスです
-
例
モデルは、その商品を購入した消費者のサンプルと、競合商品を購入した消費者のサンプルに対して実施した電話調査に基づいて、新商品の将来の売上を予測するようにトレーニングされています。競合他社の製品を購入した消費者は、アンケートへの回答を拒否する可能性が 80% 高く、そのデータはサンプルに過小評価されています。
定義の chevron_left をクリックします。
サンプリング バイアス
-
定義
サンプリング バイアスは、適切なランダム化が 使用されません。
-
例
新しい商品の将来の売上を予測するようにモデルをトレーニングする 買い物をした消費者のサンプルを対象として電話で実施したアンケート 競合製品を購入した消費者のサンプルで 説明します。調査担当者は、消費者をランダムにターゲットに設定するのではなく、メールに最初に返信した 200 人の消費者を選択しました。この消費者は、平均的な購入者よりも商品に熱心だった可能性があります。
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
グループ帰属バイアス
グループ属性バイアスとは、個人に当てはまることを、その個人が属するグループ全体に一般化する傾向を指します。グループ帰属バイアスは、次の 2 つによく表れる フォームです。
所属グループのバイアス
-
定義
グループ内バイアスは、 自分のグループ(同じグループ)や、 共有することもできます。
-
例
ソフトウェア デベロッパー向けの履歴書審査モデルをトレーニングしている 2 人の ML 担当者は、自分たちが通った同じコンピューター サイエンス アカデミーに通った応募者の方が、その役職に適していると考える傾向があります。
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
自分が属していないグループに対する均一性のバイアス
-
定義
グループ外の均一性バイアスは、 自分が参加していないグループのメンバーは、 特徴の均一性をとらえることができます。
-
例
ソフトウェア デベロッパー向けの履歴書審査モデルをトレーニングしている 2 人の ML 担当者は、コンピューター サイエンス アカデミーに通っていない応募者は、その役割に十分な専門知識を持っていないと考える傾向があります。
定義の chevron_left をクリックします。
暗黙的なバイアス
-
定義
暗黙的なバイアスは、前提条件が定められた場合に発生します。 独自の思考モデルと個人的な体験に基づいて 必ずしも一般的に当てはまるわけではありません
-
例
ジェスチャー認識モデルをトレーニングする ML 担当者は、 首を振る 相手が「いいえ」という言葉を伝えていることを示す機能です。 ただし、世界の一部の地域では、頭を振ることは「はい」を意味します。
定義の chevron_left をクリックします。
確証バイアス
-
定義
確証バイアスはモデルビルダーが 既存の信念を確証する方法で無意識にデータを処理している 導き出します
-
例
ML 担当者は、さまざまな特徴(身長、体重、品種、環境)に基づいて犬の攻撃性を予測するモデルを構築しています。その開業者は トイプードルは子供の頃から 攻撃的な犬種です。モデルのトレーニング データをキュレートする際は、 医療従事者が無意識のうちに破棄した 小型犬の忠実度を示す証拠です
<ph type="x-smartling-placeholder"></ph> をクリック chevron_left を定義します。
テスト者のバイアス
-
定義
テスト担当者のバイアスは、モデルの構築担当者が、元の仮説と一致する結果が得られるまでモデルをトレーニングし続けた場合に発生します。
-
例
ML 担当者は、さまざまな特徴(身長、体重、品種、環境)に基づいて犬の攻撃性を予測するモデルを構築しています。その開業者は トイプードルは子供の頃から 攻撃的な犬種です。トレーニング済みモデルが、ほとんどのトイプードルが比較的おとなしいと予測したため、実務担当者は、小さいトイプードルがより攻撃的であることを示す結果が得られるまで、モデルをさらに数回トレーニングしました。
定義の chevron_left をクリックします。