公平性: 反事実的公平性

これまでの公平性指標の説明では、公平性に関するトレーニング テストの例には、ユーザー属性の包括的な サブグループです。しかし、そうではないこともあります。

入学に関するデータセットに完全な人口統計データが含まれていないとします。 ユーザー属性グループのメンバーシップはごく一部で記録される たとえば、自分が担当するグループを自己特定することを選択した 属していました。この例では、候補プールを承認された候補 拒否された生徒は次のようになります。

次の 2 つのグループに分けられた 100 人の学生からなる受験者プール:
      却下された受験者(80 人の生徒アイコン)と承認された受験者(20 人)
      生徒のアイコンなど)。すべてのアイコンは灰色で表示されています(
      ユーザー属性グループは不明)。ただし、6 つのアイコンは除きます。不承認の
      2 つの生徒アイコンが色分けされているのに対し、2 つの生徒アイコンは色分けされています
      オレンジです。[Accepted](承認済み)グループでは、1 人の生徒アイコンが色合いが青く、もう 1 つは
      灰色がかったオレンジ色です。
図 5. ユーザー属性グループ メンバーシップを持つ候補者プール ほとんどすべての受験者は不明です(灰色のアイコン)。

いずれかのユーザー属性に対するモデルの予測を評価することは不可能 機会の平等または平等(ユーザー属性データがない) 94% でしたただし、単語を含むサンプルの 6% では、 個々の予測のペアを比較することもできます。 (多数派候補者とマイノリティ候補者の比較)を行い、候補者が 公平に扱われます

たとえば、特徴データを完全にレビューし、 2 人(多数派と少数派)の候補者に (下の画像のスターで注釈が付けられたグループ)であることがわかりました。 すべての点で入場資格が同じになります。モデルによって 両方の候補に対して同じ予測を行う(つまり、いずれかが両方とも拒否する) 両方の候補を受け入れる、または両方の候補を受け入れる)は、反事実的条件 公平性を理解する必要があります。反事実的公平性では 機密属性を除き、すべての点で同一のサンプル (ここでは、ユーザー属性グループ メンバーシップ)は、同じモデルになります。 できます。

前の画像と同じ候補プールですが、次の点が異なります。
      1 つの青い生徒アイコン(マジョリティ グループに属している)と、
      1 つのオレンジ色の生徒アイコン(マイノリティ グループに所属するもの)が
      グループには星のアノテーションが付けられており、この 2 つの候補が
      同じ(ユーザー属性グループを除く)。
図 6. 2 つの同一条件に対して反事実的公平性が満たされる アノテーション付きの例(ユーザー属性グループのメンバーシップによってのみ異なります) モデルは両方に対して同じ決定を行う(否承認)。

メリットとデメリット

前述のように 反事実的公平性の主な利点の一つは 予測の公平性を評価するために使用できます。 他の指標は利用できませんデータセットにすべてのデータセットが含まれていなくても、 考慮されている関連グループ属性の特徴値については、 人口統計の同等性または平等性を使用して公平性を評価 学びます。ただし、これらのグループ属性が一部のサービスで使用できる場合は、 同等のサンプルペアを特定することは 実務者は反事実的公平性を使用して を指標として使用し、予測における潜在的なバイアスの有無を確認します。

さらに ユーザー層の平等性や 社会的信用の平等といった グループ全体を評価する際に、影響を与えるバイアスの問題が 個別の予測レベルでモデルを評価します。このレベルは 対事実的公平性を使って評価します。たとえば、入学試験と モデルは、マジョリティ グループとマイノリティ グループから有望な候補者を受け入れます。 グループに属するものの、最も有望な少数派候補者は 最も適格な多数派候補の候補者は却下されましたが 受け入れられます。反事実的公平性分析は 対処できるようにする必要があります

反対に 反事実的公平性の主な欠点は モデル予測におけるバイアスの全体像を提供します。特定し、 いくつかの例のペアでいくつかの不公平を修復するだけでは、不十分な場合があります。 例のサブグループ全体に影響する系統的なバイアスの問題に対処できます。

可能な場合、実務担当者は集計と 公平性分析(人口統計の同等性や平等性などの指標を使用) 反事実的公平性分析を組み合わせて、 修復が必要な潜在的なバイアスの問題に関する幅広い分析情報を提供します。

演習:理解度をチェックする

エクササイズ図。2 つの円のグループ: 負
             予測と陽性予測」へようこそ。
             陰性予測は 50 の円で構成されます。
             39 個のグレーの円、8 個の青い円、3 個のオレンジ色の円。1 本
             青い円は「A」、1 つのオレンジ色の円は「A」というラベルが付いている。
             1 つの青い円は「C」とラベル付けされています 
             陽性の予測は 15 個の円で構成されます。
             グレーの円 10 個、青い円 3 個、および 2 個
             オレンジ色の丸いマークが付きます。「B」のラベルが付いた青い円が 1 つ、オレンジの円が 1 つある
             「B」というラベル、1 つの青い円に「C」というラベルが付いています。
             図の下の説明では 青い円が
             オレンジ色の円は
             灰色の丸は少数派を表し
             グループ メンバーが不明な例 <ph type="x-smartling-placeholder">
</ph> 図 7.サンプルのバッチに対する負の予測と陽性の予測、 A、B、C とラベル付けされた 3 つのサンプルのペアがあります。

上の図 7 の予測群のうち、 次の同一のペア(グループ メンバーシップを除く) 反事実的公平性に違反する予測を受け取った例

ペア A
ペア A の予測は反事実的公平性を満たし、 大多数派グループの例(青)と 少数派グループ(オレンジ)は同じ予測(ネガティブ)を受けました。
ペア B
ペア B の予測は反事実的公平性を満たし、 大多数派グループの例(青)と 少数派グループ(オレンジ)は同じ予測(陽性)を受けました。
ペア設定 C
ペア C の予測は 2 つの例に対するものであり、 多数派(青)で表示されます。モデルがトレーニング中に これらの同じ例に対する予測から、 モデルのパフォーマンスの問題であり、 確認できます。ただし、この結果は反事実的条件に違反していない その条件が適用されるのは、公平性の公平性を 同じサンプルがそれぞれ異なるグループから抽出されます。
いずれのペアも反事実的公平性に違反していない
ペア A とペア B の予測は反事実的公平性を満たす どちらの場合も多数決グループの例と 同じ予測が与えられます。ペア C 両方が同じグループ(多数派グループ)に属しているため、 この場合、反事実的公平性は適用されません。

概要

ユーザー属性の同等性 機会の平等 対事実的公平性が示すように、さまざまな数学的定義が 公平性についても学びました。これら 3 つは 公平性を定量化する方法です。公平性の定義の中には、お互いに 非対応 つまり 1 対 1 で 1 対 1 で同時に 適用できます。

では、どうすれば「適切」なユースケースを公平性指標は何でしょうか。必要なこと どのようなコンテキストでデータが使用されるのか そしてお客様の包括的な目標を 示していますたとえば、公平な表現を実現することが目標です。 (この場合は、ユーザー属性の同等性が最適な指標となる可能性があります)か、それとも 機会の平等を実現する(機会の平等が ?

ML の公平性について詳細を確認し、これらの問題を詳しく調べるには、このモジュールの Fairness and Machine Learning: Limitations and Opportunities(Soron Barocas、Moriz Hardt、Arvind Narayanan 著)