Моделі машинного навчання не є об’єктивними за своєю суттю. Спеціалісти з машинного навчання тренують моделі, використовуючи для цього набір навчальних прикладів, а участь людей у створенні й обробці цих даних може зробити прогнози моделі упередженими.
При створенні моделей важливо знати про поширені людські упередження, які можуть проявлятись у ваших даних, щоб завчасно вживати заходів і пом’якшувати наслідки.
Упередженість звітування
-
Визначення
Упередженість звітування виникає, коли частота подій, властивостей і висновків, які спостерігаються в наборі даних, не відповідає тому, наскільки вони поширені в реальному світі. Ця упередженість з’являється, коли люди зосереджуються на фіксації незвичних або особливо пам’ятних обставин, вважаючи, що звичайні записувати не обов’язково.
-
Приклад
Модель аналізу настроїв навчається прогнозувати, які будуть відгуки на книгу (позитивні чи негативні), на основі сукупності відгуків користувачів із популярного сайту. Більшість відгуків у навчальному наборі даних – це крайнощі (адже їх писали люди, яким книга або дуже припала до душі, або зовсім не сподобалася), оскільки навряд чи хтось напише відгук на книгу, яка не викликала сильних емоцій. Як наслідок, модель гірше прогнозує настрої відгуків, у яких використовуються делікатніші формулювання для опису книги.
Щоб переглянути визначення, натисніть chevron_left.
Історична упередженість
-
Визначення
Історична упередженість виникає тоді, коли історичні дані свідчать про певну нерівність, яка існувала у світі на той час.
-
Приклад
У наборі даних про міське житло 1960-х років містяться відомості щодо цін на нього, які свідчать про дискримінаційну політику кредитування, що діяла впродовж цього десятиліття.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість автоматизації
-
Визначення
Упередженість автоматизації — це схильність віддавати перевагу результатам, які згенерували автоматизовані системи, а не результатам неавтоматизованих систем, незалежно від коефіцієнта помилок кожної з них.
-
Приклад
Спеціалісти з машинного навчання, які працювали на виробника зубчастих коліс, з нетерпінням чекали на розгортання нової "революційної" моделі, яку вони навчили виявляти дефекти зубців, доки директор заводу не звернув увагу на те, що показники влучності й повноти її результатів на 15% нижчі, ніж людей-інспекторів.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість вибору
Упередженість вибору виникає, коли приклади для набору даних вибирають так, що вони не відображають реальний розподіл. Цей вид упередженості може проявлятися в різних формах, таких як упередженість охоплення, відсутності відповіді й вибірки.
Упередженість охоплення
-
Визначення
Упередженість охоплення виникає, коли дані вибираються не за методом репрезентативної вибірки.
-
Приклад
Модель навчається прогнозувати майбутні продажі нового продукту на основі телефонних опитувань, проведених із вибіркою споживачів, що купили цей продукт. Споживачів, які натомість вирішили купити продукт конкурентів, не опитували, через що цю групу людей не представлено в навчальних даних.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість відсутності відповіді
-
Визначення
Упередженість відсутності відповіді (або упередженість участі) виникає, коли певні дані не представлено через прогалини в процесі їх збирання.
-
Приклад
Модель навчається прогнозувати майбутні продажі нового продукту на основі телефонних опитувань, проведених із вибіркою споживачів, які купили цей продукт, і споживачів, що купили продукт конкурентів. Споживачі, які купували продукт конкурентів, на 80% частіше відмовлялися від участі в опитуванні, тому ці дані недостатньо представлено у вибірці.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість вибірки
-
Визначення
Упередженість вибірки спричиняється відсутністю випадкового порядку під час збирання даних.
-
Приклад
Модель навчається прогнозувати майбутні продажі нового продукту на основі телефонних опитувань, проведених із вибіркою споживачів, які купили цей продукт, і споживачів, що купили продукт конкурентів. Замість того, щоб випадковим чином вибрати споживачів, опитувач віддав перевагу першим 200 особам, що відповіли на електронний лист, тобто тим, які, імовірно, виявили більший інтерес до продукту, ніж середньостатистичні покупці.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість групової атрибуції
Упередженість групової атрибуції — це схильність переносити характеристики окремих осіб на цілу групу, до якої вони належать. Вона часто проявляється у двох формах.
Груповий фаворитизм
-
Визначення
Груповий фаворитизм виникає внаслідок прихильності до учасників групи, до якої людина належить, або до характеристик, які в неї також є.
-
Приклад
Двоє спеціалістів із машинного навчання, які тренують моделі перевірки резюме для розробників програмного забезпечення, схиляються до думки, що заявники, які навчалися в тій самій комп’ютерній академії, що й вони, краще підходять для роботи на цій посаді.
Щоб переглянути визначення, натисніть chevron_left.
Гомогенність чужої групи
-
Визначення
Гомогенність чужої групи – це схильність до стереотипізації окремих учасників групи, до якої не належить людина, або до уніфікації їх характеристик.
-
Приклад
Двоє спеціалістів із машинного навчання, які тренують моделі перевірки резюме для розробників програмного забезпечення, схиляються до думки, що всі заявники, які не навчалися в комп’ютерній академії, не мають достатньо досвіду для роботи на цій посаді.
Щоб переглянути визначення, натисніть chevron_left.
Прихована упередженість
-
Визначення
Прихована упередженість виникає, коли припущення робляться на основі власних моделей мислення й особистого досвіду, які не обов’язково застосовують на загальнішому рівні.
-
Приклад
Спеціаліст із машинного навчання, який тренує модель розпізнавання жестів, використовує похитування головою як ознаку того, що людина говорить слово "ні". Однак у деяких регіонах світу похитування головою насправді означає "так".
Щоб переглянути визначення, натисніть chevron_left.
Упередженість підтвердження
-
Визначення
Упередженість підтвердження з’являється, коли розробники моделей обробляють дані в спосіб, який підтверджує їхні наявні переконання й гіпотези.
-
Приклад
Спеціаліст із машинного навчання створює модель, яка прогнозує агресивність собак на основі різноманітних ознак (зросту, ваги, породи, навколишнього середовища). У дитинстві він пережив неприємну зустріч із гіперактивним карликовим пуделем, і з того часу ця порода асоціюється в нього з агресією. Під час аналізу навчальних даних моделі він несвідомо відхилив ознаки, які свідчили про слухняність менших за розміром собак.
Щоб переглянути визначення, натисніть chevron_left.
Упередженість експериментатора
-
Визначення
Упередженість експериментатора виникає, коли розробник моделі продовжує навчати її доти, доки вона не дасть результат, який відповідає його початковій гіпотезі.
-
Приклад
Спеціаліст із машинного навчання створює модель, яка прогнозує агресивність собак на основі різноманітних ознак (зросту, ваги, породи, навколишнього середовища). У дитинстві він пережив неприємну зустріч із гіперактивним карликовим пуделем, і з того часу ця порода асоціюється в нього з агресією. Коли навчена модель спрогнозувала, що більшість карликових пуделів відносно слухняні, спеціаліст перенавчав її ще кілька разів, поки не отримав результат, який свідчив про те, що карликові пуделі агресивніші.
Щоб переглянути визначення, натисніть chevron_left.