Один из методов, который мы можем использовать для оценки справедливости прогнозов нашей модели, — это сравнить уровень приема для группы большинства и группы меньшинства. Если два показателя приема равны, то прогнозы модели демонстрируют демографический паритет : шансы студента на поступление в университет не различаются в зависимости от демографической группы.
Предположим, модель приема принимает 16 кандидатов из группы большинства и 4 кандидатов из группы меньшинства. Решения модели удовлетворяют демографическому паритету, поскольку уровень принятия кандидатов как от большинства, так и от меньшинства составляет 20%.
В следующей таблице приведены количественные данные в поддержку отклоненных и принятых кандидатов на рисунке 2.
Группа большинства | Группа меньшинств | |
---|---|---|
Принял | 16 | 4 |
Отклоненный | 64 | 16 |
Скорость принятия | 20% | 20% |
Упражнение: проверьте свою интуицию
Приемная комиссия университета рассматривает возможность использования демографического паритета в качестве показателя оценки справедливости своей модели, и ей нужны ваши рекомендации относительно преимуществ и недостатков этого подхода. Можете ли вы назвать плюсы и минусы оценки прогнозов модели с использованием демографического паритета?
Продолжите читать следующий раздел «Преимущества и недостатки» , где мы кратко рассмотрим основные плюсы и минусы использования демографического паритета.
Преимущества и недостатки
Ключевым преимуществом демографического паритета в нашем примере с приемом является то, что он гарантирует, что группы большинства и меньшинства представлены в поступающем классе студентов в тех же пропорциях, что и в пуле кандидатов. То есть, если пул абитуриентов состоит из 80% кандидатов из групп большинства и 20% кандидатов из групп меньшинств, демографический паритет гарантирует, что группа поступающих также будет состоять из 80% студентов из групп большинства и 20% из студентов из групп меньшинств.
Однако демографический паритет имеет один существенный недостаток: он не учитывает распределение прогнозов для каждой демографической группы (количество студентов, классифицированных как «квалифицированные» и «неквалифицированные») при оценке того, как следует распределить 20 мест для приема.
Давайте еще раз посмотрим на состав нашего пула кандидатов сверху. Однако на этот раз мы будем классифицировать кандидатов не только по демографическим группам, но и по тому, оценила ли модель каждого кандидата как «квалифицированного» или «неквалифицированного»:
В следующей таблице приведены количественные данные в поддержку отклоненных и принятых кандидатов на рисунке 3.
Группа большинства | Группа меньшинств | |||
---|---|---|---|---|
Принял | Отклоненный | Принял | Отклоненный | |
Квалифицированный | 16 | 19 | 4 | 11 |
Неквалифицированный | 0 | 45 | 0 | 5 |
Давайте сведем в таблицу показатели приема квалифицированных студентов для обеих групп:
Несмотря на то, что в обеих группах общий уровень приема составляет 20%, что соответствует демографическому паритету, уровень приема квалифицированных студентов из большинства составляет 46%, тогда как уровень приема квалифицированных студентов из числа меньшинств составляет только 27%.
В подобных случаях, когда распределение предпочтительного ярлыка (например, «квалифицированный») сильно различается для обеих групп, демографический паритет может не быть оптимальным показателем для оценки справедливости. В следующем разделе мы рассмотрим альтернативный показатель справедливости — равенство возможностей, который учитывает эти различия.