Les modèles de machine learning (ML) ne sont pas objectifs par nature. professionnels du ML entraîner des modèles en leur fournissant un ensemble de données composé d'exemples d'entraînement dans la fourniture et le traitement de ces données peut rendre les prédictions peuvent être biaisées.
Lors de la création de modèles, il est important de connaître les biais humains courants qui peuvent dans vos données. Vous pouvez ainsi prendre des mesures proactives pour atténuer les effets de les effets.
Biais de fréquence
-
Définition
Le biais de fréquence se produit lorsque la fréquence des événements, des propriétés et/ou des résultats enregistrés dans un ensemble de données reflètent avec précision leur fréquence réelle. Ce préjugé peut survenir car les gens ont tendance à documenter les circonstances inhabituelle ou particulièrement mémorable, en supposant que l'ordinaire n'a pas doivent être enregistrés.
-
Exemple
Un modèle d'analyse des sentiments est entraîné pour prédire si des les avis positifs ou négatifs d'après un corpus d'utilisateurs des soumissions sur un site Web populaire. La majorité des avis l'ensemble de données d'entraînement reflètent des opinions extrêmes (les évaluateurs a aimé ou détesté un livre), car les utilisateurs étaient moins susceptibles de le publier. un avis sur un livre s'il n'y a pas répondu fortement. En tant que le modèle est moins à même de prédire correctement le sentiment des critiques qui utilisent un langage plus subtil pour décrire un livre.
Cliquez sur . chevron_left pour la définition.
Biais historique
-
Définition
Un biais historique se produit lorsque des données historiques reflète les inégalités qui existaient dans le monde à l’époque.
-
Exemple
Un ensemble de données sur les logements en ville des années 1960 contient des données sur les prix des logements qui reflète de prêt discriminatoires en vigueur dix ans.
Cliquez sur . chevron_left pour la définition.
Biais d'automatisation
-
Définition
Le biais d'automatisation désigne la propension à favoriser les résultats générées par les systèmes automatisés par rapport à celles générées par systèmes, quel que soit leur taux d'erreur.
-
Exemple
les professionnels du ML travaillant pour un fabricant de pignons étaient impatients de pour déployer le nouveau modèle qu'il a entraîné pour identifier dents défectueuses jusqu'à ce que le superviseur de l'usine ait signalé que les taux de précision et de rappel du modèle étaient tous deux inférieurs de 15 % des inspecteurs humains.
Cliquez sur . chevron_left pour la définition.
Biais de sélection
Un biais de sélection se produit lorsqu'un les exemples d'ensembles de données sont choisis d'une manière qui ne reflète pas distribution dans le monde réel. Le préjugé de sélection peut prendre de nombreuses formes différentes, notamment le biais de couverture, le préjugé de non-réponse et le préjugé d'échantillonnage.
Biais de couverture
-
Définition
Un biais de couverture survient lorsque les données ne sont pas sélectionnées dans de manière représentative.
-
Exemple
Un modèle est entraîné pour prédire les futures ventes d'un nouveau produit sur les enquêtes téléphoniques menées auprès d'un échantillon de consommateurs ayant acheté le produit. Consommateurs qui ont plutôt choisi d'acheter un produit concurrent n'ont pas fait l'objet d'une enquête. Par conséquent, ce groupe de personnes représentées dans les données d'entraînement.
Cliquez sur . chevron_left pour la définition.
Biais de non-réponse
-
Définition
Biais de non-réponse (également appelé biais de participation) se produit si les données finissent par être non représentatif en raison des écarts de participation à la collecte de données processus.
-
Exemple
Un modèle est entraîné pour prédire les futures ventes d'un nouveau produit sur les enquêtes téléphoniques menées auprès d'un échantillon de consommateurs ayant acheté le produit et auprès d'un échantillon de consommateurs ayant acheté produit. Les consommateurs ayant acheté le produit concurrent étaient 80% plus nombreux susceptibles de refuser de répondre à l’enquête et que leurs données étaient sous-représentés dans l'échantillon.
Cliquez sur . chevron_left pour la définition.
Biais d'échantillonnage
-
Définition
Un biais d'échantillonnage se produit si la randomisation adéquate ne sont pas utilisées lors de la collecte des données.
-
Exemple
Un modèle est entraîné pour prédire les futures ventes d'un nouveau produit sur les enquêtes téléphoniques menées auprès d'un échantillon de consommateurs ayant acheté le produit et auprès d'un échantillon de consommateurs ayant acheté produit. Au lieu de cibler aléatoirement les consommateurs, a choisi les 200 premiers clients à avoir répondu à un e-mail, qui pourrait se sont montrés plus enthousiastes que la moyenne dans le produit auprès des acheteurs.
Cliquez sur . chevron_left pour la définition.
Biais de représentativité
Biais de représentativité est une tendance à généraliser ce qui est vrai pour les individus à l'ensemble du groupe pour auxquels ils appartiennent. Le biais de représentativité se manifeste souvent dans les deux formulaires.
Biais d'appartenance
-
Définition
Le biais d'appartenance est une préférence pour les membres à votre propre groupe dont vous êtes également membre, ou pour les caractéristiques que vous partagez également.
-
Exemple
Deux professionnels du ML entraînant un modèle de sélection de CV les développeurs de logiciels sont prédisposés à croire que les candidats qui ont fréquenté la même école informatique qu'eux-mêmes sont plus qualifiés pour le poste.
Cliquez sur . chevron_left pour la définition.
Biais d’homogénéité de l’exogroupe
-
Définition
Le biais d'homogénéité de l'exogroupe est une tendance à stéréotyper les membres individuels d'un groupe auquel vous ne faites pas aient leur place, ou que leurs caractéristiques soient plus uniformes.
-
Exemple
Deux professionnels du ML entraînant un modèle de sélection de CV les développeurs de logiciels sont prédisposés à croire que tous les candidats qui n'ont pas fréquenté une école informatique n'ont pas d’expertise suffisante pour le poste.
Cliquez sur . chevron_left pour la définition.
Biais implicite
-
Définition
Un biais implicite se produit lorsque des hypothèses sont faites à partir de son propre modèle de pensée et d'expériences personnelles qui ne s'appliquent pas nécessairement de façon plus générale.
-
Exemple
Un professionnel du ML entraîne un modèle de reconnaissance des gestes à l'aide d'une hochement de tête une fonctionnalité pour indiquer qu'une personne communique le mot « non ». Cependant, dans certaines régions du monde, on peut secouer la tête signifie « oui ».
Cliquez sur . chevron_left pour la définition.
Biais de confirmation
-
Définition
Le biais de confirmation survient lorsque les créateurs de modèles traiter inconsciemment des données de manière à confirmer des croyances préexistantes ; et hypothèses.
-
Exemple
Un professionnel du ML crée un modèle capable de prédire le niveau d'agressivité chez les chiens en fonction de diverses caractéristiques (taille, poids, race, de l'environnement de recherche). Le praticien a eu une expérience désagréable avec un caniche toy hyperactif dans son enfance et a depuis associé la race à l'agressivité. Lors de la préparation des données d'entraînement du modèle, le professionnel a inconsciemment supprimé les fonctionnalités qui fournissaient des preuves de la docilité chez les petits chiens.
Cliquez sur . chevron_left pour la définition.
Préjugé de l'expérimentateur
-
Définition
Le biais de l'expérimentateur survient lorsqu'un créateur de modèle continue d'entraîner le modèle jusqu'à ce qu'il obtienne un résultat conforme son hypothèse initiale.
-
Exemple
Un professionnel du ML crée un modèle capable de prédire le niveau d'agressivité chez les chiens en fonction de diverses caractéristiques (taille, poids, race, de l'environnement de recherche). Le praticien a eu une expérience désagréable avec un caniche toy hyperactif dans son enfance et a depuis associé la race à l'agressivité. Lorsque le modèle entraîné a prédit les caniches nains soient relativement dociles, le praticien a suivi le modèle plusieurs fois jusqu'à ce qu'il produise un résultat des caniches plus petits pour qu'ils soient plus violents.
Cliquez sur . chevron_left pour la définition.