Об’єктивність: типи упередженості

Моделі машинного навчання не є об’єктивними за своєю суттю. Спеціалісти з машинного навчання тренують моделі, використовуючи для цього набір навчальних прикладів, а участь людей у створенні й обробці цих даних може зробити прогнози моделі упередженими.

При створенні моделей важливо знати про поширені людські упередження, які можуть проявлятись у ваших даних, щоб завчасно вживати заходів і пом’якшувати наслідки.

Упередженість звітування

Історична упередженість

Упередженість автоматизації

Упередженість вибору

Упередженість вибору виникає, коли приклади для набору даних вибирають так, що вони не відображають реальний розподіл. Цей вид упередженості може проявлятися в різних формах, таких як упередженість охоплення, відсутності відповіді й вибірки.

Упередженість охоплення

Упередженість відсутності відповіді

Упередженість вибірки

Упередженість групової атрибуції

Упередженість групової атрибуції — це схильність переносити характеристики окремих осіб на цілу групу, до якої вони належать. Вона часто проявляється у двох формах.

Груповий фаворитизм

Гомогенність чужої групи

Прихована упередженість

Упередженість підтвердження

Упередженість експериментатора

Вправа. Перевірте свої знання

Які з наведених нижче типів упереджень могли частково спричинити спотворені результати моделі, що прогнозує прийом у коледжі, яку описано у вступній частині?
Історична упередженість
Модель, яка прогнозує прийом, навчалася на даних про студентів за останні 20 років. Якщо студенти з меншин були недостатньо представлені в цих даних, модель може відтворювати ту саму історичну нерівність у своїх прогнозах.
Груповий фаворитизм
Модель вступу навчали нинішні студенти університетів, які можуть несвідомо віддавати перевагу особам, що мають схоже з ними походження. Це могло вплинути на те, як вони готували й конструювали дані, на основі яких навчали модель.
Упередженість підтвердження
Модель вступу навчали нинішні студенти університетів, що, імовірно, мали певні уявлення про те, які кваліфікаційні критерії допоможуть успішно вивчати інформатику. Вони могли ненавмисно підбирати або конструювати дані так, щоб модель підтверджувала ці наявні переконання.
Упередженість автоматизації
Упередженість автоматизації пояснює, чому приймальна комісія вирішила використовувати модель машинного навчання для відбору кандидатів: можливо, її члени вважали, що результати автоматизованої системи будуть кращими, ніж рішення людей. Однак упередженість автоматизації не дає уявлення про те, чому прогнози моделі виявилися спотвореними.