Obiektywność: rodzaje uprzedzeń

Modele systemów uczących się nie są z natury obiektywne. Specjaliści ML trenowanie modeli przez dostarczanie im zbioru danych z przykładami treningowymi, zaangażowanie w udostępnianie i selekcję tych danych może sprawić, że model prognozy podatne na uprzedzenia.

Podczas tworzenia modeli ważne jest, aby mieć świadomość ludzkich uprzedzeń, które mogą w swoich danych i podejmować działania, aby zniwelować wpływ efekty.

Błąd raportowania

Tendencyjność historyczna

Błąd automatyzacji

Korekta wyboru

Błąd doboru występuje, jeśli przykłady w zbiorach danych są wybierane w sposób, który nie odzwierciedla ich rzeczywistej dystrybucji. Błąd wyboru może przybierać różne formy, łącznie z stronniczością pokrycia, brakiem odpowiedzi i błędem próbkowania.

Błąd pokrycia

Korekta braku odpowiedzi

Błąd próbkowania

Błąd atrybucji grupy

Błąd uogólnienia jest to tendencja do uogólniania całej grupy, że to, co dotyczy poszczególnych osób, których należą. Błąd atrybucji grupowej często przejawia się w 2 następujących kwestiach: formularzami.

Stronniczość wewnątrzgrupowa

Błąd jednorodności grupy obcej

Uprzedzenia ogólne

Błąd potwierdzenia

Wpływ eksperymentu

Ćwiczenie: sprawdź swoją wiedzę

Które z tych uprzedzeń mogły przyczynić się do powstania do zniekształconych prognoz w modelu rekrutacji na studia, w ?
Tendencyjność historyczna
Model przyjęć został wytrenowany na podstawie danych uczniów z przeszłości. 20 lat. Jeśli w tych danych liczba uczniów z mniejszości była niedostateczna, model mógł odtworzyć te same historyczne nierówności przy prognozowaniu nowych danych uczniów.
Stronniczość wewnątrzgrupowa
Model rekrutacji został wytrenowany przez obecnych studentów, którzy nieświadomie mogli decydować o tym, pochodzących z podobnych środowisk, mogło wpłynąć na sposób wybierania danych lub opracowywania funkcji na których model został wytrenowany.
Błąd potwierdzenia
Model rekrutacji został wytrenowany przez obecnych studentów, którzy prawdopodobnie mieli wcześniej przekonania co do typów kwalifikacji które są powiązane z sukcesem w programie informatycznym. Może nieumyślnie wyselekcjonowali dane lub zmodyfikowali funkcje, aby model poparł te przekonania.
Błąd automatyzacji
Błąd automatyzacji może wyjaśnić, dlaczego komisja rekrutacyjna wybrała używać modelu ML do podejmowania decyzji o przyjęciu do programu; mogą mieć sądził, że zautomatyzowany system da lepsze wyniki niż decyzji podejmowanych przez ludzi. Automatyzacja nie zapewnia jednak żadnych statystyk dotyczących tego, dlaczego prognozy modelu zostały zniekształcone.