Os modelos de machine learning (ML) não são objetivos naturalmente. Profissionais que trabalham com machine learning para treinar modelos, alimentando-os com um conjunto de dados com exemplos de treinamento envolvimento no provisionamento e na curadoria desses dados pode tornar previsões suscetíveis a vieses.
Ao criar modelos, é importante estar ciente dos vieses humanos comuns que podem nos seus dados, para que você possa tomar medidas proativas para reduzir efeitos
Viés de relatório
-
Definição
O viés de relatório ocorre quando a frequência eventos, propriedades e/ou resultados capturados em um conjunto de dados refletem com precisão sua frequência no mundo real. Esse viés pode surgir porque as pessoas tendem a se concentrar em documentar as circunstâncias que são incomuns ou especialmente memoráveis, supondo que o comum precisam ser gravados.
-
Exemplo
Um modelo de análise de sentimento é treinado para prever avaliações são positivas ou negativas com base no corpus de envios para um site popular. A maioria das avaliações conjunto de dados de treinamento reflete opiniões extremas (revisores que adoravam ou odiavam um livro), porque as pessoas eram menos propensas a enviar uma resenha de um livro se não tiver uma reação forte. Como resultado, o modelo é menos capaz de prever corretamente o sentimento de avaliações que usam uma linguagem mais sutil para descrever um livro.
Clique em chevron_left para a definição.
Viés histórico
-
Definição
O viés histórico ocorre quando os dados históricos refletem as desigualdades que existiam no mundo naquela época.
-
Exemplo
Um conjunto de dados imobiliários de uma cidade da década de 1960 contém dados sobre preços de imóveis que reflita práticas discriminatórias de empréstimo em vigor durante esse período década.
Clique em chevron_left para a definição.
Viés de automação
-
Definição
O viés de automação é uma tendência de favorecer os resultados geradas por sistemas automatizados em vez de por sistemas não automatizados independentemente das taxas de erro de cada um.
-
Exemplo
os profissionais de ML que trabalhavam para um fabricante de rodas estavam ansiosos para implantar a nova "inovação" que treinaram para identificar defeitos dos dentes, até que o supervisor da fábrica apontou que as taxas de recall e precisão do modelo foram 15% menores do que de inspetores humanos.
Clique em chevron_left para a definição.
Viés de seleção
O viés de seleção ocorre quando exemplos do conjunto de dados são escolhidos de uma maneira que não reflete seus distribuição real. O viés de seleção pode assumir muitas formas diferentes, incluindo viés de cobertura, viés de não resposta e viés de amostragem.
Viés de convergência
-
Definição
O viés de cobertura ocorre quando os dados não são selecionados de forma representativa.
-
Exemplo
Um modelo é treinado para prever vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto. Consumidores que optaram por comprar um produto de um concorrente não foram pesquisados e, como resultado, esse grupo de pessoas não foi representados nos dados de treinamento.
Clique em chevron_left para a definição.
Viés de não resposta
-
Definição
Viés de não resposta (também conhecido como viés de participação) ocorre se os dados acabam sendo não representativos devido a lacunas de participação na coleta de dados de desenvolvimento de software.
-
Exemplo
Um modelo é treinado para prever vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto e com uma amostra de consumidores que compraram um produto produto. Os consumidores que compraram o produto da concorrência foram 80% mais propensos a se recusar a completar a pesquisa, e seus dados foram sub-representadas na amostra.
Clique em chevron_left para a definição.
Viés de amostragem
-
Definição
O viés de amostragem ocorre quando a randomização adequada é não são usados durante a coleta de dados.
-
Exemplo
Um modelo é treinado para prever vendas futuras de um novo produto com base em pesquisas por telefone realizadas com uma amostra de consumidores que compraram o produto e com uma amostra de consumidores que compraram um produto produto. Em vez de segmentar aleatoriamente os consumidores, o pesquisador escolheu os 200 primeiros consumidores que responderam a um e-mail, que poderiam ficaram mais entusiasmados com o produto do que a média compradores.
Clique em chevron_left para a definição.
Viés de atribuição a grupos
Viés de atribuição a grupos é uma tendência de generalizar o que é verdade para os indivíduos para todo o grupo para às quais pertencem. O viés de atribuição a grupos geralmente se manifesta nos dois formas.
Viés de grupo
-
Definição
O viés de grupo é uma preferência pelos membros de seu próprio grupo ao qual você pertence ou por características que você também compartilha.
-
Exemplo
Dois profissionais de ML treinando um modelo de triagem de currículo para desenvolvedores de software estão predispostos a acreditar que os candidatos que estudaram na mesma academia de ciência da computação que os dois têm mais qualificação para a função.
Clique em chevron_left para a definição.
Viés de homogeneidade externa ao grupo
-
Definição
O viés de homogeneidade externa ao grupo é uma tendência de estereótipos individuais de membros de um grupo para o qual você não pertencem, ou as características são mais uniformes.
-
Exemplo
Dois profissionais de ML treinando um modelo de triagem de currículo para desenvolvedores de software estão predispostos a acreditar que todos os candidatos que não frequentaram uma faculdade de ciência da computação não têm conhecimento suficiente para a função.
Clique em chevron_left para a definição.
Viés implícito
-
Definição
O viés implícito ocorre quando há suposições. com base no próprio modelo de pensamento e experiências pessoais que não se aplicam necessariamente aos mais gerais.
-
Exemplo
Um profissional de ML que treina um modelo de reconhecimento de gestos usa um agitar a cabeça enquanto um recurso para indicar que uma pessoa está comunicando a palavra "não". No entanto, em algumas regiões do mundo, um balanço de cabeça realmente significa "sim".
Clique em chevron_left para a definição.
Viés de confirmação
-
Definição
O viés de confirmação ocorre quando os criadores de modelos processar dados inconscientemente de maneiras que confirmem crenças pré-existentes e hipóteses.
-
Exemplo
Um profissional de ML está criando um modelo que prevê agressividade em cães com base em uma variedade de características (altura, peso, raça, ou ambiente de execução). O profissional teve um encontro desagradável com um poodle toy hiperativo quando criança e desde então tem associado a raça com agressão. Ao fazer a curadoria dos dados de treinamento do modelo, o profissional descartou inconscientemente os atributos que ofereciam e evidências de docilidade em cães menores.
Clique em chevron_left para a definição.
Viés do experimentador
-
Definição
O viés do experimentador ocorre quando um criador de modelo continua treinando um modelo até que ele produza um resultado alinhado com sua hipótese original.
-
Exemplo
Um profissional de ML está criando um modelo que prevê agressividade em cães com base em uma variedade de características (altura, peso, raça, ou ambiente de execução). O profissional teve um encontro desagradável com um poodle toy hiperativo quando criança e desde então tem associado a raça com agressão. Quando o modelo treinado previu poodles de brinquedo sejam relativamente dóceis, o praticante retreinado o modelo várias vezes até produzir um resultado que mostra poodles menores são mais violentos.
Clique em chevron_left para a definição.