À medida que você prepara seus dados para avaliação e treinamento de modelo, é importante manter as questões de imparcialidade em mente e auditar possíveis fontes de viés, para que você possa mitigar proativamente os efeitos antes de lançar o modelo em produção.
Onde o viés pode estar oculto? Aqui estão alguns sinais de alerta a serem observados em seu conjunto de dados.
Valores de atributo ausentes
Se o conjunto de dados tem um ou mais atributos com valores ausentes para um alguns exemplos, podendo indicar que determinadas características do seu conjunto de dados estão sub-representadas.
Exercício: testar seu conhecimento
Você descobre que 1.500 dos 5.000 exemplos no conjunto de treinamento são valores de temperamento ausentes. Quais das opções a seguir são possíveis origens de viés que você deve investigar?
Valores de atributo inesperados
Ao analisar dados, você também deve procurar exemplos que contenham valores de atributos que se destacam como incomuns ou incomuns. Esses recursos inesperados valores podem indicar problemas que ocorreram durante a coleta de dados ou outros e imprecisões que possam introduzir viés.
Exercício: testar seu conhecimento
Analise o seguinte conjunto hipotético de exemplos para treinar um cão adotado. modelo de adoção.
raça | idade (anos) | Peso (lb) | temperamento | shedding_level |
---|---|---|---|---|
poodle brinquedo | 2 | 12 | animado | low |
golden retriever | 7 | 65 | calmo | high |
labrador retriever | 35 | 73 | calmo | high |
buldogue francês | 0,5 | 11 | calmo | médio |
raça mista desconhecida | 4 | 45 | animado | high |
Bass Hound | 9 | 48 | calmo | médio |
raça | idade (anos) | Peso (lb) | temperamento | shedding_level |
---|---|---|---|---|
poodle brinquedo | 2 | 12 | animado | low |
golden retriever | 7 | 65 | calmo | high |
labrador retriever | 35 | 73 | calmo | high |
buldogue francês | 0,5 | 11 | calmo | médio |
raça mista desconhecida | 4 | 45 | animado | high |
Bass Hound | 9 | 48 | calmo | médio |
O cachorro mais antigo a ter sua idade confirmada pelo Guinness World Records era Bluey, um gado australiano que viveu até 29 anos e 5 meses. Por isso, parece implausível que o labrador retriever tenha, na verdade, 35 anos de idade, e a probabilidade de que a idade do cachorro tenha sido calculada ou registrada de forma incorreta (talvez o cachorro tenha na verdade 3,5 anos de idade). Esse erro pode também pode ser indicativo de problemas de precisão mais amplos com dados de idade no conjunto de dados que merecem uma investigação mais aprofundada.
Desvio de dados
Qualquer tipo de desvio nos dados, em que certos grupos ou características possam estar sub ou super-representados em relação à prevalência no mundo real, podem introduzir viés no modelo.
Ao auditar o desempenho do modelo, é importante não apenas analisar os resultados agregar, mas dividir os resultados por subgrupo. Por exemplo, no caso de nosso modelo de adoção de cães de resgate, para garantir a imparcialidade, não é suficiente basta olhar para a precisão geral. Também devemos auditar o desempenho por subgrupo para garantir que o modelo tenha o mesmo desempenho para todas as raças, faixas etárias e de tamanho definido.
Mais adiante neste módulo, em Evaluating for Bias, vamos conferir mais de perto os diferentes métodos de avaliação de modelos por subgrupo.