Справедливость: равенство возможностей

В предыдущем разделе мы оценили справедливость нашей модели приема, используя демографический паритет, сравнив общие показатели приема для обеих демографических групп.

В качестве альтернативы мы могли бы сравнить показатели приема только квалифицированных кандидатов из группы большинства и группы меньшинства. Если показатели приема квалифицированных студентов в обеих группах равны, модель демонстрирует равенство возможностей : студенты с нашим предпочтительным ярлыком («имеющие право на поступление») имеют равные шансы на поступление, независимо от того, к какой демографической группе они принадлежат.

Давайте вернемся к нашему пулу кандидатов из предыдущего раздела:

Группа большинства Группа меньшинств
Квалифицированный 35 15
Неквалифицированный 45 5

Предположим, что модель приема принимает 14 кандидатов из группы большинства и 6 кандидатов из группы меньшинства. Решения модели удовлетворяют равенству возможностей, поскольку уровень принятия кандидатов как квалифицированного большинства, так и квалифицированного меньшинства составляет 40%.

Пул из 100 кандидатов, разделенных на две группы: отклоненные кандидаты (66 синих студентов, 14 оранжевых студентов) и принятые кандидаты (14 синих студентов, 6 оранжевых студентов). В группе «Принято» все 20 учащихся заштрихованы зеленым цветом (что означает квалификацию), а в группе «Отклонено» 21 синий учащийся и 9 оранжевых учащихся также закрашены зеленым цветом.
Рисунок 4. Распределение отклоненных и принятых кандидатов: все квалифицированные студенты как из групп большинства, так и из меньшинств выделены зеленым цветом. Из 35 квалифицированных студентов большинства были приняты 14. Из 15 квалифицированных студентов из числа меньшинств были приняты 6. Таким образом, в обеих группах процент приема квалифицированных студентов составляет 40%.

В следующей таблице приведены количественные данные в поддержку отклоненных и принятых кандидатов на рисунке 4.

Группа большинства Группа меньшинств
Принял Отклоненный Принял Отклоненный
Квалифицированный 14 21 6 9
Неквалифицированный 0 45 0 5

Преимущества и недостатки

Ключевое преимущество равенства возможностей заключается в том, что оно позволяет варьировать соотношение положительных и отрицательных прогнозов модели в зависимости от демографических групп при условии, что модель одинаково успешно прогнозирует предпочтительный ярлык («имеет право на поступление») для обеих групп.

Прогнозы модели на рисунке 4 не удовлетворяют демографическому паритету, поскольку шанс быть принятым у учащегося из группы большинства составляет 17,5%, а у учащегося из группы меньшинства — 30%. Однако вероятность того, что квалифицированный студент будет принят, составляет 40%, независимо от того, к какой группе он принадлежит, что, возможно, является более справедливым результатом в данном конкретном случае использования модели.

Одним из недостатков равенства возможностей является то, что оно предназначено для случаев использования, где существует четко выраженный предпочтительный ярлык. Если одинаково важно, чтобы модель прогнозировала как положительный класс («имеет право на поступление»), так и отрицательный класс («не имеет права на поступление») для всех демографических групп, возможно, имеет смысл вместо этого использовать метрику «уравненные шансы» , которая обеспечивает равные шансы. показатели успеха для обоих лейблов.

Еще одним недостатком равенства возможностей является то, что оно оценивает справедливость путем сравнения коэффициентов ошибок в совокупности для демографических групп, что не всегда осуществимо. Например, если бы в наборе данных нашей модели приема не было функции demographic_group , было бы невозможно определить показатели приема квалифицированных кандидатов большинства и меньшинства и сравнить их, чтобы увидеть, соблюдается ли равенство возможностей.

В следующем разделе мы рассмотрим еще один показатель справедливости — контрфактическую справедливость, который можно использовать в сценариях, где демографические данные не существуют для всех примеров.

Упражнение: Проверьте свое понимание.

Верно или неверно: модель бинарной классификации не может обеспечить одновременно демографический паритет и равенство возможностей в одном и том же наборе прогнозов.
Истинный
Прогнозы модели могут удовлетворять как демографическому паритету, так и равенству возможностей. Посмотрите, сможете ли вы придумать сценарий, в котором удовлетворяются оба показателя, а затем выберите другой вариант ответа ниже, чтобы увидеть наше объяснение.
ЛОЖЬ

Прогнозы модели могут удовлетворять как демографическому паритету, так и равенству возможностей.

Например, предположим, что бинарный классификатор (чьей предпочтительной меткой является положительный класс) оценивается на 100 примерах, а результаты показаны в следующих матрицах путаницы, разбитых по демографическим группам (большинство и меньшинство):

Группа большинства Группа меньшинств
Прогнозируемый положительный Прогнозируемый отрицательный Прогнозируемый положительный Прогнозируемый отрицательный
Фактический позитив 6 12 3 6
Фактический отрицательный результат 10 36 6 21

\(\text{Positive Rate} = \frac{6+10}{6+10+12+36} = \frac{16}{64} = \text{25%}\)

\(\text{True Positive Rate} = \frac{6}{6+12} = \frac{6}{18} = \text{33%}\)

\(\text{Positive Rate} = \frac{3+6}{3+6+6+21} = \frac{9}{36} = \text{25%}\)

\(\text{True Positive Rate} = \frac{3}{3+6} = \frac{3}{9} = \text{33%}\)

Как группы большинства, так и меньшинства имеют коэффициент положительного прогнозирования 25%, что соответствует демографическому паритету, и истинно положительный уровень (процент примеров с предпочтительным ярлыком, которые правильно классифицированы) 33%, что соответствует равенству возможностей.