Imparcialidade: tipos de viés

Os modelos de machine learning (ML) não são objetivos naturalmente. Profissionais que trabalham com machine learning para treinar modelos, alimentando-os com um conjunto de dados com exemplos de treinamento envolvimento no provisionamento e na curadoria desses dados pode tornar previsões suscetíveis a vieses.

Ao criar modelos, é importante estar ciente dos vieses humanos comuns que podem nos seus dados, para que você possa tomar medidas proativas para reduzir efeitos

Viés de relatório

Viés histórico

Viés de automação

Viés de seleção

O viés de seleção ocorre quando exemplos do conjunto de dados são escolhidos de uma maneira que não reflete seus distribuição real. O viés de seleção pode assumir muitas formas diferentes, incluindo viés de cobertura, viés de não resposta e viés de amostragem.

Viés de convergência

Viés de não resposta

Viés de amostragem

Viés de atribuição a grupos

Viés de atribuição a grupos é uma tendência de generalizar o que é verdade para os indivíduos para todo o grupo para às quais pertencem. O viés de atribuição a grupos geralmente se manifesta nos dois formas.

Viés de grupo

Viés de homogeneidade externa ao grupo

Viés implícito

Viés de confirmação

Viés do experimentador

Exercício: testar seu conhecimento

Qual dos seguintes tipos de viés poderia ter contribuído as previsões distorcidas do modelo de admissão na faculdade descrito em da introdução?
Viés histórico
O modelo de admissões foi treinado com base em históricos de estudantes 20 anos. Se os estudantes de minorias fossem sub-representados nesses dados, o modelo poderia ter reproduzido as mesmas desigualdades históricas ao fazer previsões sobre novos dados de estudantes.
Viés de grupo
O modelo de admissões foi treinado por estudantes universitários atuais, que poderiam ter uma preferência inconsciente por aceitar estudantes com origens semelhantes à dele, que podem ter afetado a forma como a curadoria ou a engenharia de atributos dos dados foi feita. em que o modelo foi treinado.
Viés de confirmação
O modelo de admissões foi treinado por estudantes universitários atuais, que provavelmente já tinham crenças sobre que tipos de qualificações se correlacionam com o sucesso no programa de ciência da computação. Eles poderiam fizeram a curadoria ou engenharia de atributos dos dados para que o modelo confirmou essas crenças.
Viés de automação
O viés de automação pode explicar por que o comitê de matrículas escolheu usar um modelo de ML para tomar decisões de admissão; a pessoa pode ter acreditavam que um sistema automatizado produziria melhores resultados do que decisões tomadas por humanos. No entanto, o viés de automação não fornece insights sobre o motivo de as previsões do modelo serem distorcidas.