Équité: testez vos connaissances

  1. Vrai ou faux: un biais historique se produit lorsqu'un modèle est entraîné sur d'anciennes données.

  2. Les ingénieurs entraînent un modèle de régression pour prédire le contenu calorique des repas en fonction d'une variété de données de caractéristiques extraites de sites Web de recettes du monde entier, y compris la taille des portions, les ingrédients et les techniques de préparation. Parmi les problèmes de données suivants, lesquels sont des sources de biais potentielles qui doivent être examinées plus en détail ?

    Choisissez autant de réponses que vous jugez nécessaires.

  3. Un modèle de détection du sarcasme a été entraîné sur 80 000 messages: 40 000 messages d'adultes (18 ans et plus) et 40 000 messages de mineurs (moins de 18 ans). Le modèle a ensuite été évalué sur un ensemble de test de 20 000 messages, dont 10 000 des adultes et 10 000 des mineurs. Les matrices de confusion suivantes affichent les résultats pour chaque groupe (une prédiction positive signifie une classification de "sarcastique" ; une prédiction négative signifie une classification de "non sarcastique"):

    Adultes

    Vrais positifs (VP): 512 Faux positifs (FP): 51
    Faux négatifs (FN): 36 Vrais négatifs (VN): 9401
    Précision = VP/(VP + FP) = 0,909
    Rappel = VP/(VP + FN) = 0,934

    Mineurs

    Vrais positifs (VP): 2147 Faux positifs (FP): 96
    Faux négatifs (FN): 2177 Vrais négatifs (VN): 5580
    Précision = VP/(VP + FP) = 0,957
    Rappel = VP/(VP + FN) = 0,497

    Parmi les affirmations suivantes concernant les performances de l'ensemble de test du modèle, lesquelles sont vraies ?

    Choisissez autant de réponses que vous jugez nécessaires.

  4. Quelle hypothèse pourrait expliquer les écarts de performances du sous-groupe sur l'ensemble de test pour le modèle de détection du sarcasme ci-dessus ?

    Choisissez autant de réponses que vous jugez nécessaires.

  5. Les ingénieurs travaillent à réentraîner le modèle de sarcasme ci-dessus pour corriger les incohérences dans la précision de la détection du sarcasme parmi les données démographiques d’âge, mais ce modèle est déjà en production. Laquelle des stratégies correctives suivantes permettra d'atténuer les erreurs dans les prédictions du modèle ?