Imparcialidade: tipos de viés

Os modelos de aprendizado de máquina (ML) não são objetivos por natureza. Os profissionais de ML treinam modelos ao alimentar um conjunto de dados com exemplos de treinamento. O envolvimento humano no provisionamento e na curadoria desses dados pode tornar as previsões de um modelo suscetíveis a vieses.

Ao criar modelos, é importante estar ciente dos vieses humanos comuns que podem se manifestar nos dados para que você possa tomar medidas preventivas para mitigar os efeitos.

Viés de relatório

Viés histórico

Viés de automação

Viés de seleção

O viés de seleção ocorre quando os exemplos de um conjunto de dados são escolhidos de uma forma que não corresponde à distribuição no mundo real. O viés de seleção pode ter muitas formas diferentes, incluindo viés de cobertura, viés de não resposta e viés de amostragem.

Viés de convergência

Viés de não resposta

Viés de amostragem

Viés de atribuição a grupos

O viés de atribuição a grupos é uma tendência de generalizar as características de uma pessoa para todo o grupo a que ela pertence. O viés de atribuição a grupos geralmente se manifesta nas duas formas a seguir.

Viés de grupo

Viés de homogeneidade externa ao grupo

Viés implícito

Viés de confirmação

Viés do experimentador

Exercício: testar seu conhecimento

Qual dos seguintes tipos de viés pode ter contribuído para as previsões distorcidas no modelo de admissão nas faculdades descrito na introdução?
Viés histórico
O modelo de admissão foi treinado com registros de estudantes dos últimos 20 anos. Se os estudantes de minoria estivessem sub-representados nesses dados, o modelo poderia reproduzir as mesmas desigualdades históricas ao fazer previsões com base em novos dados de estudantes.
Viés de grupo
O modelo de admissão foi treinado por estudantes universitários, que podem ter tido uma preferência inconsciente por admitir estudantes com origens semelhantes às deles, o que pode ter afetado a forma como eles selecionaram ou criaram recursos com os dados em que o modelo foi treinado.
Viés de confirmação
O modelo de admissão foi treinado por estudantes universitários, que provavelmente tinham crenças preexistentes sobre quais tipos de qualificações estão relacionados ao sucesso no programa de ciência da computação. Eles podem ter curado ou projetado os dados de forma inadvertida para que o modelo confirmasse essas crenças.
Viés de automação
O viés de automação pode explicar por que a comissão de admissão escolheu usar um modelo de ML para tomar decisões de admissão. Eles podem ter acreditado que um sistema automatizado produziria resultados melhores do que as decisões tomadas por humanos. No entanto, o viés de automação não fornece nenhum insight sobre por que as previsões do modelo acabaram sendo distorcidas.