Lorsque vous préparez vos données pour l'entraînement et l'évaluation du modèle, il est important de garder à l’esprit les problèmes d’impartialité et d’effectuer un audit des sources potentielles de biais, afin que vous puissiez d'atténuer les effets de manière proactive avant de publier votre modèle en production.
Où les biais pourraient-ils se cacher ? Voici quelques signaux d'alerte à surveiller dans votre ensemble de données.
Valeurs de caractéristiques manquantes
Si votre ensemble de données comporte une ou plusieurs caractéristiques dont les valeurs sont manquantes pour un grand Il peut s'agir d'un indicateur du fait que certaines caractéristiques de votre ensemble de données sont sous-représentés.
Exercice: tester vos connaissances
Vous découvrez que sur les 5 000 exemples de l'ensemble d'entraînement, 1 500 il manque des valeurs de tempérament. Parmi les propositions suivantes, lesquelles sont des sources potentielles de biais à étudier ?
Valeurs de caractéristiques inattendues
Lorsque vous explorez des données, vous devez également rechercher des exemples qui contiennent des valeurs de caractéristiques qui se démarquent comme particulièrement inhabituelles ou inhabituelles. Ces fonctionnalités inattendues peuvent indiquer des problèmes survenus lors de la collecte de données ou d'autres des inexactitudes qui pourraient introduire un biais.
Exercice: tester vos connaissances
Examiner l'ensemble hypothétique suivant d'exemples pour le dressage d'un chien de sauvetage d'adoption.
race | âge (années) | poids (en kg) | caractère | shedding_level |
---|---|---|---|---|
caniche nain | 2 | 12 | excitant | bas |
golden retriever | 7 | 65 | calme | high |
labrador retriever | 35 | 73 | calme | high |
bouledogue français | 0,5 | 11 | calme | moyen |
race mélangée inconnue | 4 | 45 | excitant | high |
basset hound | 9 | 48 | calme | moyen |
race | âge (années) | poids (en kg) | caractère | shedding_level |
---|---|---|---|---|
caniche nain | 2 | 12 | excitant | bas |
golden retriever | 7 | 65 | calme | high |
labrador retriever | 35 | 73 | calme | high |
bouledogue français | 0,5 | 11 | calme | moyen |
race mélangée inconnue | 4 | 45 | excitant | high |
basset hound | 9 | 48 | calme | moyen |
Le plus ancien chien dont l'âge a été confirmé par le Guinness World Records était Bluey, un chien de bétail australien qui a vécu jusqu'à 29 ans et 5 mois. Sachant cela, semble tout à fait plausible que le labrador retriever ait en fait 35 ans, et plus de chances que l'âge du chien ait été calculé ou enregistré à tort (peut-être que le chien a en fait 3,5 ans). Cette erreur peut Cela peut également indiquer des problèmes d'exactitude plus larges avec les données sur l'âge dans le jeu de données qui méritent un examen plus approfondi.
Décalage de données
Toute sorte d'asymétrie dans vos données, où certains groupes ou certaines caractéristiques sous-représentés ou surreprésentés par rapport à leur prévalence dans le monde réel, peuvent d'introduire un biais dans votre modèle.
Lors de l'audit des performances d'un modèle, il est important non seulement d'examiner les résultats agréger, mais pour ventiler les résultats par sous-groupe. Par exemple, dans le cas notre modèle d'adoption des chiens de sauvetage, pour garantir l'impartialité, simplement de regarder la justesse globale. Nous devons également auditer les performances par sous-groupe pour s'assurer que le modèle fonctionne de la même manière pour chaque race, groupe d'âge et groupe de tailles.
Plus loin dans ce module, dans Évaluer les biais, nous examinons plus en détail les différentes méthodes d'évaluation des modèles par sous-groupe.