Cette page a été traduite par l'API Cloud Translation. Équité: testez vos connaissances Revenir au parcours Vrai ou faux: un biais historique se produit lorsqu'un modèle est entraîné sur d'anciennes données. Vrai Faux Les ingénieurs entraînent un modèle de régression pour prédire le contenu calorique des repas en fonction d'une variété de données de caractéristiques extraites de sites Web de recettes du monde entier, y compris la taille des portions, les ingrédients et les techniques de préparation. Parmi les problèmes de données suivants, lesquels sont des sources de biais potentielles qui doivent être examinées plus en détail ? Choisissez autant de réponses que vous jugez nécessaires. Environ 4 000 des 40 000 exemples d'entraînement ne comportent pas de valeur pour la caractéristique "taille de la diffusion". Environ 5 000 exemples d'entraînement comportaient des mesures en unités impériales (onces, livres, etc.), tandis que les 35 000 autres exemples comportaient des mesures en unités métriques (grammes, litres, etc.). Environ 100 des 40 000 exemples d'entraînement comportaient des valeurs d'ingrédients qui semblaient très probablement incorrectes (par exemple, 100 nuits de beurre). Certains repas populaires étaient sous-représentés dans les données d'entraînement par rapport aux autres repas populaires (par exemple, il y avait 200 exemples d'entraînement pour le dosa, mais seulement 10 pour la pizza). Un modèle de détection du sarcasme a été entraîné sur 80 000 messages: 40 000 messages d'adultes (18 ans et plus) et 40 000 messages de mineurs (moins de 18 ans). Le modèle a ensuite été évalué sur un ensemble de test de 20 000 messages, dont 10 000 des adultes et 10 000 des mineurs. Les matrices de confusion suivantes affichent les résultats pour chaque groupe (une prédiction positive signifie une classification de "sarcastique" ; une prédiction négative signifie une classification de "non sarcastique"): Adultes Vrais positifs (VP): 512 Faux positifs (FP): 51 Faux négatifs (FN): 36 Vrais négatifs (VN): 9401 Précision = VP/(VP + FP) = 0,909 Rappel = VP/(VP + FN) = 0,934 Mineurs Vrais positifs (VP): 2147 Faux positifs (FP): 96 Faux négatifs (FN): 2177 Vrais négatifs (VN): 5580 Précision = VP/(VP + FP) = 0,957 Rappel = VP/(VP + FN) = 0,497 Parmi les affirmations suivantes concernant les performances de l'ensemble de test du modèle, lesquelles sont vraies ? Choisissez autant de réponses que vous jugez nécessaires. Le modèle est plus performant sur les exemples d'adultes que sur ceux de mineurs. Les 10 000 messages envoyés par des adultes constituent un ensemble de données avec déséquilibre des classes. Les 10 000 messages envoyés par des mineurs constituent un ensemble de données avec déséquilibre des classes. Environ 50% des messages envoyés par des mineurs sont classés à tort comme "sarcastiques". Le modèle ne parvient pas à classer environ 50% des messages sarcastiques de mineurs dans la catégorie "sarcastique". Quelle hypothèse pourrait expliquer les écarts de performances du sous-groupe sur l'ensemble de test pour le modèle de détection du sarcasme ci-dessus ? Choisissez autant de réponses que vous jugez nécessaires. Le modèle fait trop d'erreur du côté de la prédiction du terme "sarcastique". Par conséquent, elle commettent davantage d'erreurs lors de la classification SMS, car l'ensemble de test contient plus de messages sarcastiques de mineurs. Le modèle a été évalué sur des exemples plus négatifs (non sarcastiques) provenant de mineurs que d'adultes, ce qui a généré plus d'erreurs pour les mineurs. Le strasme dans les SMS de mineurs était plus subtil et moins susceptible d'être signalé par le modèle. Les adultes reçoivent beaucoup moins de messages sarcastiques que de mineurs. Si le modèle était évalué sur un ensemble de messages réservés aux adultes plus équilibrés, le rappel pourrait baisser pour ce sous-groupe. Les ingénieurs travaillent à réentraîner le modèle de sarcasme ci-dessus pour corriger les incohérences dans la précision de la détection du sarcasme parmi les données démographiques d’âge, mais ce modèle est déjà en production. Laquelle des stratégies correctives suivantes permettra d'atténuer les erreurs dans les prédictions du modèle ? Limiter l'utilisation du modèle aux SMS envoyés par des mineurs Ajustez la sortie du modèle de sorte qu'elle renvoie "sarcastique" pour tous les SMS envoyés par des mineurs, indépendamment de la prédiction initiale du modèle. Lorsque le modèle prédit "non sarcastique" pour les SMS envoyés par des mineurs, ajustez la sortie pour que le modèle renvoie la valeur "je ne sais pas". Envoyer les réponses error_outline Une erreur s'est produite lors de la notation du quiz. Veuillez réessayer.