Correttezza: tipi di bias

I modelli di machine learning non sono intrinsecamente obiettivi. Gli ingegneri addestrano i modelli fornendo loro un set di dati di esempi di addestramento e il coinvolgimento umano nel provisioning e nella selezione di questi dati può rendere le previsioni di un modello suscettibili ai pregiudizi.

Quando si creano modelli, è importante essere a conoscenza dei pregiudizi umani comuni che possono manifestarsi nei dati, in modo da poter adottare misure proattive per mitigarne gli effetti.

Differenziazione dei report

I proporzioni dei report si verificano quando la frequenza di eventi, proprietà e/o risultati acquisiti in un set di dati non riflette con precisione la frequenza reale. Questa tendenza può nascere perché le persone tendono a documentare situazioni insolite o particolarmente memorabili, supponendo che l'ordinario possa "andare senza dire".

Bias di automazione

La modalità di automazione tende a preferire i risultati generati dai sistemi automatici rispetto a quelli generati dai sistemi non automatici, indipendentemente dalle percentuali di errore di ciascuno.

Bias di selezione

L'opzione Bias di selezione si verifica se gli esempi di un set di dati vengono scelti in un modo che non rispecchia la distribuzione reale. Il bias di selezione può assumere molte forme diverse:

  • Bias di copertura: i dati non vengono selezionati in modo rappresentativo.
  • Bias di non risposta (o Bias di partecipazione): i dati risultano non rappresentativi a causa di lacune della partecipazione nel processo di raccolta dei dati.
  • Bias di campionamento: la randomizzazione corretta non viene utilizzata durante la raccolta dei dati.

Bias attribuzione gruppo

I proprimenti di attribuzione dei gruppi tendono a generalizzare ciò che è vero degli individui per un intero gruppo a cui appartengono. Le manifestazioni chiave di questo bias sono due:

  • Bias di gruppo: una preferenza per i membri di un gruppo di cui appartieni anche o per le caratteristiche che condividi anche.
  • Bias di omogeneità all'esterno del gruppo: la tendenza a stereotipiare i singoli membri di un gruppo a cui non appartieni o a visualizzarne le caratteristiche come più uniformi.

Bias impliciti

I pregiudizi impliciti si basano su ipotesi basate sui propri modelli mentali ed esperienze personali che non si applicano necessariamente con maggiore frequenza.

Una forma comune di bias implicito è il pregiudizio di conferma, in cui i modellisti elaborano inconsapevolmente i dati in modi che confermano ipotesi e ipotesi preesistenti. In alcuni casi, un generatore di modelli potrebbe continuare ad addestrare un modello fino a quando non produce un risultato in linea con la sua ipotesi originale; questo è chiamato scostamento esperimento.