Équité: types de biais

Les modèles de machine learning ne sont pas objectifs en soi. Les ingénieurs entraînent des modèles en leur fournissant un ensemble de données d'exemples d'entraînement, et une intervention humaine dans la fourniture et l'organisation de ces données peut rendre les prédictions d'un modèle sujettes à des biais.

Lorsque vous créez des modèles, il est important de connaître les biais humains courants qui peuvent se manifester dans vos données. Vous pouvez ainsi prendre des mesures proactives pour atténuer leurs effets.

Biais de fréquence

Un biais de fréquence survient lorsque la fréquence des événements, des propriétés et/ou des résultats collectés dans un ensemble de données ne correspond pas exactement à leur fréquence réelle. Ce biais peut se produire, car les utilisateurs ont tendance à documenter les circonstances inhabituelles ou particulièrement mémorables, en supposant que l'ordinaire puisse "parvenir sans le dire".

Biais d'automatisation

Le biais d'automatisation est une tendance à privilégier les résultats des systèmes automatisés par rapport à ceux générés par des systèmes non automatisés, indépendamment des taux d'erreur de chaque système.

Biais de sélection

Le biais de sélection survient si les exemples d'un ensemble de données sont choisis d'une manière qui ne reflète pas leur distribution réelle. Le biais de sélection peut prendre de nombreuses formes:

  • Biais de couverture: les données ne sont pas sélectionnées de manière représentative.
  • Biais de non-réponse (ou biais de participation): les données finissent par ne pas être représentatives en raison d'écarts de participation dans le processus de collecte des données.
  • Biais d'échantillonnage : la bonne randomisation n'est pas utilisée lors de la collecte des données.

Biais d'attribution de groupe

Le biais de représentativité désigne la propension à généraliser ce qui est vrai pour des individus à l'ensemble d'un groupe auquel ils appartiennent. Les deux principales manifestations de ce biais sont les suivantes:

  • Biais d'appartenance: préférence pour les membres d'un groupe auquel vous appartenez également ou pour des caractéristiques que vous partagez également.
  • Biais d'homogénéité de l'exogroupe : tendance à stéréotyper les individus membres d'un groupe auquel vous n'appartenez pas, ou à considérer leurs caractéristiques comme plus uniformes.

Biais implicite

Le biais implicite se produit lorsque des hypothèses sont fondées sur des modèles mentaux et des expériences personnelles qui ne s'appliquent pas nécessairement de manière plus générale.

Une forme de biais implicite est un biais de confirmation : les outils de création de modèles traitent inconsciemment les données de manière à confirmer des croyances et des hypothèses préexistantes. Dans certains cas, un constructeur de modèles peut continuer à entraîner un modèle jusqu'à ce qu'il obtienne un résultat conforme à son hypothèse d'origine. C'est ce que l'on appelle le biais de testeur.