このページは Cloud Translation API によって翻訳されました。

公平性: バイアスの軽減

トレーニングデータでバイアスの原因が特定されたら、その影響を軽減するために事前に対策を講じることができます。機械学習（ML）エンジニアがバイアスを修復するために一般的に採用する戦略は、次の 2 つです。

トレーニングデータの拡張。
モデルの損失関数を調整する。

トレーニングデータの拡張

トレーニングデータの監査で、データの欠落、不正確、偏りに関する問題が見つかった場合、問題に対処する最も簡単な方法は、追加のデータを収集することです。

ただし、トレーニングデータを拡張することは理想的ですが、このアプローチの欠点は、利用可能なデータが不足している場合や、データ収集を妨げるリソース制約がある場合、実現できない可能性があることです。たとえば、より多くのデータを収集すると費用や時間がかかりすぎる場合や、法的/プライバシーに関する制限によって実現できない場合などがあります。

モデルの最適化関数の調整

追加のトレーニングデータを収集できない場合は、モデルのトレーニング中に損失の計算方法を調整することで、バイアスを軽減する方法もあります。通常、ログ損失などの最適化関数を使用して、誤ったモデル予測をペナルティにします。ただし、ログロスではサブグループメンバーシップは考慮されません。そのため、ログ損失を使用する代わりに、トレーニングデータで特定された不均衡を打ち消すように、公平性を考慮した方法でエラーをペナルティにするため、最適化関数を選択できます。

TensorFlow Model Remediation Library には、モデルのトレーニング中に次の 2 種類のバイアス軽減手法を適用するためのユーティリティが用意されています。

MinDiff: MinDiff は、2 つのグループの予測分布の違いにペナルティを加えることにより、2 つの異なるデータスライス（男性/女性の生徒と非二元性生徒）のエラーをバランスよくすることを目的としています。
反事実的ロジットペアリング: 反事実的ロジットペアリング（CLP）は、特定の例の機密属性を変更しても、その例に対するモデルの予測が変更されないようにすることを目的としています。たとえば、トレーニングデータセットに、特徴値が同じで、gender 値が male の例と gender 値が nonbinary の例が 2 つある場合、これらの 2 つの例の予測が異なると、CLP はペナルティを追加します。

最適化関数の調整に選択する手法は、モデルのユースケースによって異なります。次のセクションでは、これらのユースケースを検討し、モデルの公平性を評価するタスクに取り組む方法について詳しく説明します。

演習: 理解度を確認する

バイアス軽減手法に関する以下の説明のうち、正しいものはどれですか。

MinDiff と CLP の両方で、機密性の高い属性に関連するモデルのパフォーマンスの差異がペナルティの対象になります。

どちらの手法も、トレーニングデータで機密属性がどのように表現されているかにおける不均衡から生じる予測エラーをペナルティ化して、バイアスを軽減することを目的としています。

MinDiff は、データの異なるスライスに対する予測の全体的な分布の違いに対してペナルティを課します。一方、CLP は、個々のサンプルペアの予測の不一致に対してペナルティを課します。

MinDiff は、2 つのサブグループのスコア分布を調整することでバイアスに対処します。CLP は、個々のサンプルがサブグループのメンバーシップのみを理由に異なる扱いを受けないようにすることで、バイアスに対処します。

トレーニングデータセットに例を追加すると、モデルの予測のバイアスに対抗できます。

トレーニング例を追加することは、バイアスを軽減するための効果的な戦略ですが、新しいトレーニングデータの構成が重要になります。追加のトレーニング例に元のデータと同様の不均衡が見られる場合、既存のバイアス軽減に役立つ可能性は低くなります。

トレーニングデータを追加してバイアスを軽減する場合は、トレーニング中に MinDiff または CLP も適用しないでください。

トレーニングデータの拡張と、MinDiff や CLP などの手法の適用は補完的です。たとえば、ML エンジニアは、十分な追加トレーニングデータを収集してパフォーマンスの差異を 30% 削減し、MinDiff を使用して差異をさらに 50% 削減できる場合があります。

バイアスを特定する（10 分）

バイアスの評価（5 分）

公平性: バイアスの軽減

トレーニング データの拡張

モデルの最適化関数の調整

演習: 理解度を確認する

トレーニングデータの拡張