Imparcialidade: como identificar vieses
Mantenha tudo organizado com as coleções
Salve e categorize o conteúdo com base nas suas preferências.
Ao preparar seus dados para treinamento e avaliação do modelo, é importante
considerar questões de imparcialidade e auditar possíveis fontes de
viés para
mitigar os efeitos de forma proativa antes de lançar o modelo na produção.
Onde o viés pode estar escondido? Confira alguns alertas vermelhos no seu conjunto de dados.
Valores de atributo ausentes
Se seu conjunto de dados tem um ou mais atributos com valores ausentes para um grande número de exemplos, isso pode ser um indicador de que algumas características importantes do conjunto de dados estão sub-representadas.
Exercício: testar seu conhecimento
Você está treinando um modelo para prever a capacidade de adoção de cães resgatados com base
em vários recursos, incluindo raça, idade, peso, temperamento
e quantidade de pelos perdidos por dia. Seu objetivo é garantir que o modelo tenha um bom desempenho em todos os tipos de cães, independentemente das características físicas ou comportamentais
Você descobre que 1.500 dos 5.000 exemplos no conjunto de treinamento estão
sem valores de temperamento. Quais das opções a seguir são possíveis fontes
de viés que você deve investigar?
É mais provável que os dados de temperamento estejam faltando para determinadas raças de
cães.
Se a disponibilidade de dados de temperamento estiver relacionada à raça do cachorro,
isso poderá resultar em previsões de adoção menos precisas para
determinadas raças.
Os dados de temperamento têm mais probabilidade de estar ausentes em cães com menos de 12
meses de idade
Se a disponibilidade dos dados de temperamento estiver relacionada à idade, isso poderá resultar em previsões de adoção menos precisas para
filhotes em comparação com cães adultos.
Os dados de temperamento estão faltando para todos os cães resgatados de grandes cidades.
À primeira vista, pode parecer que isso não é uma possível fonte
de viés, já que os dados ausentes afetariam todos os cães de grandes
cidades igualmente, independentemente da raça, idade, peso etc.
No entanto, ainda precisamos considerar que o local de origem de um cão
pode servir como um substituto para essas características
físicas. Por exemplo, se os cães de grandes cidades têm
muito mais probabilidade de serem menores do que os de áreas mais rurais, isso pode resultar em previsões de adaptabilidade menos precisas
para cães de menor peso ou certas raças de cães pequenos.
Os dados de temperamento estão ausentes do conjunto de dados de forma aleatória.
Se os dados de temperamento estiverem realmente ausentes aleatoriamente, isso não será
uma possível fonte de viés. No entanto, é possível que os dados de temperamento
pareçam estar ausentes aleatoriamente, mas uma investigação mais aprofundada
pode revelar uma explicação para a discrepância. Portanto, é importante fazer uma análise completa para descartar outras possibilidades, em vez de presumir que as lacunas de dados são aleatórias.
Valores de atributo inesperados
Ao explorar dados, procure também exemplos que contenham valores de atributos que se destaquem como especialmente incomuns ou incomuns. Esses valores de recurso
inesperados podem indicar problemas que ocorreram durante a coleta de dados ou outras
imprecisões que podem introduzir viés.
Exercício: testar seu conhecimento
Confira o conjunto hipotético de exemplos a seguir para treinar um modelo de adoção de cães
resgatados.
raça |
idade (anos) |
peso (lb) |
temperamento |
shedding_level |
poodle de brinquedo |
2 |
12 |
animado |
baixo |
golden retriever |
7 |
65 |
calmo |
high |
labrador retriever |
35 |
73 |
calmo |
high |
buldogue francês |
0,5 |
11 |
calmo |
médio |
raça desconhecida |
4 |
45 |
excitável |
high |
Basset Hound |
9 |
48 |
calmo |
médio |
Você consegue identificar algum problema com os dados do elemento?
Clique aqui para conferir a resposta
raça |
idade (anos) |
peso (lb) |
temperamento |
shedding_level |
poodle de brinquedo |
2 |
12 |
animado |
baixo |
golden retriever |
7 |
65 |
calmo |
high |
labrador retriever |
35 |
73 |
calmo |
high |
buldogue francês |
0,5 |
11 |
calmo |
médio |
raça desconhecida |
4 |
45 |
excitável |
high |
Basset Hound |
9 |
48 |
calmo |
médio |
O cão mais velho a ter a idade verificada pelo Guinness World Records
foi Bluey,
um Australian Cattle Dog que viveu até os 29 anos e 5 meses. Dado isso, parece bastante implausível que o labrador tenha 35 anos de idade e a idade do cachorro tenha sido calculada ou registrada incorretamente (talvez o cachorro tenha, na verdade, 3,5 anos de idade). Esse erro também pode indicar problemas de precisão mais amplos com dados de idade no conjunto de dados que merecem investigação adicional.
Desvio de dados
Qualquer tipo de distorção nos dados, em que determinados grupos ou características podem ser sub-ou super-representados em relação à prevalência no mundo real, pode introduzir viés no modelo.
Ao auditar a performance do modelo, é importante não apenas analisar os resultados no agregado, mas também dividir os resultados por subgrupo. Por exemplo, no caso do nosso modelo de adoção de cães resgatados, para garantir a imparcialidade, não basta apenas analisar a precisão geral. Também precisamos auditar a performance por subgrupo
para garantir que o modelo tenha um bom desempenho para cada raça, grupo de idade e
tamanho de cachorro.
Mais adiante neste módulo, em Como avaliar vieses, vamos
conhecer melhor os diferentes métodos de avaliação de modelos por subgrupo.
Exceto em caso de indicação contrária, o conteúdo desta página é licenciado de acordo com a Licença de atribuição 4.0 do Creative Commons, e as amostras de código são licenciadas de acordo com a Licença Apache 2.0. Para mais detalhes, consulte as políticas do site do Google Developers. Java é uma marca registrada da Oracle e/ou afiliadas.
Última atualização 2024-11-10 UTC.
[null,null,["Última atualização 2024-11-10 UTC."],[[["\u003cp\u003eTraining data should represent real-world prevalence to avoid bias in machine learning models.\u003c/p\u003e\n"],["\u003cp\u003eMissing or unexpected feature values in the dataset can be indicative of potential sources of bias.\u003c/p\u003e\n"],["\u003cp\u003eData skew, where certain groups are under- or over-represented, can introduce bias and should be addressed.\u003c/p\u003e\n"],["\u003cp\u003eEvaluating model performance by subgroup ensures fairness and equal performance across different characteristics.\u003c/p\u003e\n"],["\u003cp\u003eAuditing for bias requires a thorough review of data and model outcomes to mitigate potential negative impacts.\u003c/p\u003e\n"]]],[],null,["# Fairness: Identifying bias\n\nAs you prepare your data for model training and evaluation, it's important to\nkeep issues of fairness in mind and audit for potential sources of\n[**bias**](/machine-learning/glossary#bias-ethicsfairness), so you can\nproactively mitigate its effects before releasing your model into production.\n\nWhere might bias lurk? Here are some red flags to look out for in your dataset.\n\nMissing feature values\n----------------------\n\nIf your dataset has one or more features that have missing values for a large\nnumber of examples, that could be an indicator that certain key characteristics\nof your dataset are under-represented.\n\n### Exercise: Check your understanding\n\nYou're training a model to predict adoptability of rescue dogs based on a variety of features, including breed, age, weight, temperament, and quantity of fur shed each day. Your goal is to ensure the model performs equally well on all types of dogs, irrespective of their physical or behavioral characteristics \n\n\u003cbr /\u003e\n\nYou discover that 1,500 of the 5,000 examples in the training set are\nmissing temperament values. Which of the following are potential sources\nof bias you should investigate? \nTemperament data is more likely to be missing for certain breeds of dogs. \nIf the availability of temperament data correlates with dog breed, then this might result in less accurate adoptability predictions for certain dog breeds. \nTemperament data is more likely to be missing for dogs under 12 months in age \nIf the availability of temperament data correlates with age, then this might result in less accurate adoptability predictions for puppies versus adult dogs. \nTemperament data is missing for all dogs rescued from big cities. \nAt first glance, it might not appear that this is a potential source of bias, since the missing data would affect all dogs from big cities equally, irrespective of their breed, age, weight, etc. However, we still need to consider that the location a dog is from might effectively serve as a proxy for these physical characteristics. For example, if dogs from big cities are significantly more likely to be smaller than dogs from more rural areas, that could result in less accurate adoptability predictions for lower-weight dogs or certain small-dog breeds. \nTemperament data is missing from the dataset at random. \nIf temperament data is truly missing at random, then that would not be a potential source of bias. However, it's possible temperament data might appear to be missing at random, but further investigation might reveal an explanation for the discrepancy. So it's important to do a thorough review to rule out other possibilities, rather than assume data gaps are random.\n\nUnexpected feature values\n-------------------------\n\nWhen exploring data, you should also look for examples that contain feature values\nthat stand out as especially uncharacteristic or unusual. These unexpected feature\nvalues could indicate problems that occurred during data collection or other\ninaccuracies that could introduce bias.\n\n### Exercise: Check your understanding\n\nReview the following hypothetical set of examples for training a rescue-dog\nadoptability model.\n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nCan you identify any problems with the feature data? \nClick here to see the answer \n\n| breed | age (yrs) | weight (lbs) | temperament | shedding_level |\n|---------------------|-----------|--------------|-------------|----------------|\n| toy poodle | 2 | 12 | excitable | low |\n| golden retriever | 7 | 65 | calm | high |\n| labrador retriever | 35 | 73 | calm | high |\n| french bulldog | 0.5 | 11 | calm | medium |\n| unknown mixed breed | 4 | 45 | excitable | high |\n| basset hound | 9 | 48 | calm | medium |\n\nThe oldest dog to have their age verified by *Guinness World Records*\nwas [Bluey](https://wikipedia.org/wiki/Bluey_(long-lived_dog)),\nan Australian Cattle Dog who lived to be 29 years and 5 months. Given that, it\nseems quite implausible that the labrador retriever is actually 35 years old,\nand more likely that the dog's age was either calculated or recorded\ninaccurately (maybe the dog is actually 3.5 years old). This error could\nalso be indicative of broader accuracy issues with age data in the dataset\nthat merit further investigation.\n\nData skew\n---------\n\nAny sort of skew in your data, where certain groups or characteristics may be\nunder- or over-represented relative to their real-world prevalence, can\nintroduce bias into your model.\n\nWhen auditing model performance, it's important not only to look at results in\naggregate, but to break out results by subgroup. For example, in the case of\nour rescue-dog adoptability model, to ensure fairness, it's not sufficient to\nsimply look at overall accuracy. We should also audit performance by subgroup\nto ensure the model performs equally well for each dog breed, age group, and\nsize group.\n\nLater in this module, in [Evaluating for Bias](/machine-learning/crash-course/fairness/evaluating-for-bias), we'll\ntake a closer look at different methods for evaluating models by subgroup.\n| **Key terms:**\n|\n- [Bias (ethics/fairness)](/machine-learning/glossary#bias-ethicsfairness) \n[Help Center](https://support.google.com/machinelearningeducation)"]]