Obiektywność: rodzaje uprzedzeń

Modele systemów uczących się nie są z natury obiektywne. Specjaliści ML trenowanie modeli przez dostarczanie im zbioru danych z przykładami treningowymi, zaangażowanie w udostępnianie i selekcję tych danych może sprawić, że model prognozy podatne na uprzedzenia.

Podczas tworzenia modeli ważne jest, aby mieć świadomość ludzkich uprzedzeń, które mogą w swoich danych i podejmować działania, aby zniwelować wpływ efekty.

Błąd raportowania

Tendencyjność historyczna

Błąd automatyzacji

Korekta wyboru

Błąd doboru występuje, jeśli przykłady w zbiorach danych są wybierane w sposób, który nie odzwierciedla ich rzeczywistej dystrybucji. Błąd wyboru może przybierać różne formy, łącznie z uprzedzeniami związanymi z zasięgiem, brakiem odpowiedzi i błędem próbkowania.

Błąd pokrycia

Błąd związany z brakiem odpowiedzi

Błąd próbkowania

Błąd atrybucji grupy

Błąd uogólnienia jest to tendencja do uogólniania całej grupy, że to, co dotyczy poszczególnych osób, należących do nich. Błąd uogólnienia występuje często w 2 postaciach:

Stronniczość wewnątrzgrupowa

Błąd jednorodności grupy obcej

Uprzedzenia ogólne

Błąd potwierdzenia

Wpływ eksperymentu

Ćwiczenie: sprawdź swoją wiedzę

Który z tych typów uprzedzenia mógł przyczynić się do nieprawidłowych prognoz w modelu przyjęć na studia opisanym we wstępie?
Tendencyjność historyczna
Model rekrutacji został wytrenowany na podstawie danych o studentach z ostatnich 20 lat. Jeśli w tych danych niedostatecznie reprezentowane były mniejszości, model mógł odtworzyć te same historyczne nierówności podczas prognozowania na podstawie nowych danych o uczniach.
Stronniczość wewnątrzgrupowa
Model rekrutacji został wytrenowany przez obecnych studentów, którzy nieświadomie mogli decydować o tym, pochodzących z podobnych środowisk, mogło wpłynąć na sposób wybierania danych lub opracowywania funkcji na których model został wytrenowany.
Błąd potwierdzenia
Model rekrutacji został wytrenowany przez obecnych studentów, którzy prawdopodobnie mieli wcześniej przekonania co do typów kwalifikacji które są powiązane z sukcesem w programie informatycznym. Może nieumyślnie wyselekcjonowali dane lub zmodyfikowali funkcje, aby model poparł te przekonania.
Błąd automatyzacji
Błąd automatyzacji może wyjaśnić, dlaczego komisja rekrutacyjna wybrała używać modelu ML do podejmowania decyzji o przyjęciu do programu; mogą mieć sądził, że zautomatyzowany system da lepsze wyniki niż decyzji podejmowanych przez ludzi. Automatyzacja nie zapewnia jednak żadnych statystyk dotyczących tego, dlaczego prognozy modelu zostały zniekształcone.