Справедливость: виды предвзятости

Модели машинного обучения (ML) не являются объективными по своей сути. Специалисты по МО обучают модели, предоставляя им набор данных обучающих примеров, а участие человека в предоставлении и обработке этих данных может сделать прогнозы модели подверженными предвзятости.

При построении моделей важно знать о распространенных человеческих предубеждениях, которые могут проявляться в ваших данных, чтобы вы могли принять упреждающие меры для смягчения их последствий.

Предвзятость в отчетности

Историческая предвзятость

Предвзятость автоматизации

Критерий отбора

Смещение выбора возникает, если примеры набора данных выбраны таким образом, который не отражает их реальное распределение. Ошибка отбора может принимать различные формы, включая ошибку охвата, ошибку отсутствия ответов и ошибку выборки.

Смещение охвата

Ошибка отсутствия ответа

Смещение выборки

Предвзятость групповой атрибуции

Предвзятость групповой атрибуции — это тенденция обобщать то, что верно в отношении отдельных лиц, на всю группу, к которой они принадлежат. Предвзятость групповой атрибуции часто проявляется в двух следующих формах.

Внутригрупповая предвзятость

Предвзятость однородности аутгруппы

Неявное смещение

Подтверждение смещения

Предвзятость экспериментатора

Упражнение: Проверьте свое понимание.

Какой из следующих типов предвзятости мог способствовать искажению прогнозов в модели приема в колледж, описанной во введении ?
Историческая предвзятость
Модель приема была обучена на студенческих записях за последние 20 лет. Если бы студенты из числа меньшинств были недостаточно представлены в этих данных, модель могла бы воспроизвести то же историческое неравенство при прогнозировании новых данных о студентах.
Внутригрупповая предвзятость
Модель приема была обучена нынешними студентами университета, которые могли неосознанно отдавать предпочтение приему студентов из среды, схожей с их собственной, что могло повлиять на то, как они курировали или разрабатывали характеристики данных, на которых обучалась модель.
Подтверждение смещения
Модель приема была обучена нынешними студентами университета, у которых, вероятно, уже существовали представления о том, какие типы квалификаций коррелируют с успехом в программе информатики. Они могли непреднамеренно отредактировать или спроектировать данные так, чтобы модель подтвердила эти существующие убеждения.
Предвзятость автоматизации
Предвзятость автоматизации может объяснить, почему приемная комиссия решила использовать модель машинного обучения для принятия решений о приеме; они могли полагать, что автоматизированная система даст лучшие результаты, чем решения, принимаемые людьми. Однако предвзятость автоматизации не дает никакого понимания того, почему прогнозы модели оказались искаженными.