Os modelos de aprendizado de máquina (ML) não são objetivos por natureza. Os profissionais de ML treinam modelos ao alimentar um conjunto de dados com exemplos de treinamento. O envolvimento humano no provisionamento e na curadoria desses dados pode tornar as previsões de um modelo suscetíveis a vieses.
Ao criar modelos, é importante estar ciente dos vieses humanos comuns que podem se manifestar nos dados para que você possa tomar medidas preventivas para mitigar os efeitos.
Viés de relatório
-
Definição
O viés de relatório ocorre quando a frequência dos eventos, propriedades e/ou resultados capturados em um conjunto de dados não reflete com precisão a frequência no mundo real. Isso acontece porque as pessoas tendem a documentar as circunstâncias mais incomuns ou memoráveis, acreditando que o ordinário não precisa ser registrado.
-
Exemplo
Um modelo de análise de sentimento é treinado para prever se as avaliações do livro são positivas ou negativas com base em um corpus de envios de usuários para um site popular. A maioria das avaliações no conjunto de dados de treinamento reflete opiniões extremas (comentários que amam ou odeiam um livro), porque as pessoas têm menos probabilidade de enviar uma avaliação de um livro se não responderem com veemência. Como resultado, o modelo tem menos capacidade de prever corretamente o sentimento de avaliações que usam uma linguagem mais sutil para descrever um livro.
Clique em chevron_left para ver a definição.
Viés histórico
-
Definição
O viés histórico ocorre quando os dados históricos refletem desigualdades que existiam no mundo naquele momento.
-
Exemplo
Um conjunto de dados de habitação de uma cidade dos anos 1960 contém dados de preço das casas que refletem práticas de empréstimo discriminatórias em vigor durante essa década.
Clique em chevron_left para ver a definição.
Viés de automação
-
Definição
O viés de automação é a tendência de favorecer os resultados gerados por sistemas automatizados em vez de sistemas não automatizados, independentemente das taxas de erro de cada um.
-
Exemplo
Profissionais de ML que trabalham para um fabricante de rodas dentadas estavam ansiosos para implantar o novo modelo "revolucionário" que treinaram para identificar defeitos nos dentes, até que o supervisor da fábrica apontou que as taxas de precisão e recuperação do modelo eram 15% menores do que as dos inspetores humanos.
Clique em chevron_left para ver a definição.
Viés de seleção
O viés de seleção ocorre quando os exemplos de um conjunto de dados são escolhidos de uma forma que não corresponde à distribuição no mundo real. O viés de seleção pode ter muitas formas diferentes, incluindo viés de cobertura, viés de não resposta e viés de amostragem.
Viés de convergência
-
Definição
O viés de cobertura ocorre quando os dados não são selecionados de maneira representativa.
-
Exemplo
Um modelo é treinado para prever as vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto. Os consumidores que optaram por comprar um produto concorrente não foram entrevistados. Como resultado, esse grupo de pessoas não foi representado nos dados de treinamento.
Clique em chevron_left para ver a definição.
Viés de não resposta
-
Definição
O viés de não resposta (também conhecido como viés de participação) ocorre quando os dados não são representativos devido a lacunas de participação no processo de coleta de dados.
-
Exemplo
Um modelo é treinado para prever as vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto e com uma amostra de consumidores que compraram um produto concorrente. Os consumidores que compraram o produto da concorrência tinham 80% mais probabilidade de se recusar a responder à pesquisa, e os dados deles foram sub-representados na amostra.
Clique em chevron_left para ver a definição.
Viés de amostragem
-
Definição
O viés de amostragem ocorre quando a ordenação aleatória adequada não é usada durante a coleta de dados.
-
Exemplo
Um modelo é treinado para prever as vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto e com uma amostra de consumidores que compraram um produto concorrente. Em vez de segmentar os consumidores aleatoriamente, o pesquisador escolheu os primeiros 200 consumidores que responderam a um e-mail, que talvez estivessem mais entusiasmados com o produto do que os compradores médios.
Clique em chevron_left para ver a definição.
Viés de atribuição a grupos
O viés de atribuição a grupos é uma tendência de generalizar as características de uma pessoa para todo o grupo a que ela pertence. O viés de atribuição a grupos geralmente se manifesta nas duas formas a seguir.
Viés de grupo
-
Definição
O viés de grupo é uma preferência por membros do seu grupo a que você pertence ou por características que você também tem em comum.
-
Exemplo
Dois profissionais de ML que treinam um modelo de triagem de currículos para desenvolvedores de software estão predispostos a acreditar que os candidatos que frequentaram a mesma academia de ciência da computação que eles são mais qualificados para a função.
Clique em chevron_left para conferir a definição.
Viés de homogeneidade externa ao grupo
-
Definição
O viés de homogeneidade externa ao grupo é a tendência de estereotipar membros individuais de um grupo ao qual você não pertence ou de achar que as características deles são mais uniformes.
-
Exemplo
Dois profissionais de ML que treinam um modelo de triagem de currículos para desenvolvedores de software estão predispostos a acreditar que todos os candidatos que não frequentaram uma academia de ciência da computação não têm experiência suficiente para a função.
Clique em chevron_left para conferir a definição.
Viés implícito
-
Definição
O viés implícito ocorre quando são feitas suposições com base no próprio modelo de pensamento e em experiências pessoais que não se aplicam aos demais.
-
Exemplo
Um profissional de ML que treina um modelo de reconhecimento de gestos usa o agitação de cabeça como recurso para indicar que uma pessoa está comunicando a palavra "não". No entanto, em algumas regiões do mundo, um balançar de cabeça significa “sim”.
Clique em chevron_left para ver a definição.
Viés de confirmação
-
Definição
O viés de confirmação ocorre quando os criadores de modelos processam dados inconscientemente de maneiras que confirmam crenças e hipóteses pré-existentes.
-
Exemplo
Um profissional de ML está criando um modelo que prevê a agressividade em cães com base em vários recursos (altura, peso, raça, ambiente). O profissional teve um encontro desagradável com um caniche hiperativo quando criança e, desde então, associa a raça à agressividade. Ao selecionar os dados de treinamento do modelo, o profissional descartou inconscientemente recursos que forneciam evidências de docilidade em cães menores.
Clique em chevron_left para ver a definição.
Viés do experimentador
-
Definição
O viés do experimentador ocorre quando um criador de modelos continua treinando um modelo até produzir um resultado alinhado à hipótese original.
-
Exemplo
Um profissional de ML está criando um modelo que prevê a agressividade em cães com base em vários recursos (altura, peso, raça, ambiente). O profissional teve um encontro desagradável com um poodle toy hiperativo quando criança e, desde então, associou a raça à agressão. Quando o modelo treinado previu que a maioria dos poodles de brinquedo era relativamente dócil, o profissional treinou o modelo várias vezes até produzir um resultado mostrando que os poodles menores eram mais violentos.
Clique em chevron_left para conferir a definição.