Testez vos connaissances: débogage du modèle

Pour les questions suivantes, cliquez sur votre sélection pour développer et vérifier votre réponse.

Approche de la modélisation

Votre ami et Mel comme les licornes. En fait, vous aimez tellement les licornes que vous décidez de prédire l'apparence des licornes grâce au machine learning. Vous disposez d'un ensemble de données contenant 10 000 apparitions de licornes. Pour chaque apparence, l'ensemble de données contient le lieu, l'heure de la journée, le dénivelé, la température, l'humidité, la densité de la population, la couverture des arbres, la présence d'un arc-en-ciel et de nombreuses autres caractéristiques.

Vous souhaitez commencer à développer votre modèle de ML. Parmi les approches suivantes, laquelle est un bon moyen de démarrer le développement ?
Le licorne apparaît souvent à l'aube et au crépuscule. Par conséquent, utilisez la caractéristique "heure de la journée" pour créer un modèle linéaire.
Bonne réponse. Un modèle linéaire qui utilise une ou deux caractéristiques hautement prédictives est un moyen efficace de commencer.
Prédire l'apparence de la licorne est très difficile. Par conséquent, utilisez un réseau de neurones profond avec toutes les caractéristiques disponibles.
Mauvaise réponse. Commencer avec un modèle complexe complique le débogage.
Commencez avec un modèle linéaire simple, mais utilisez toutes les caractéristiques pour vous assurer que le modèle simple dispose de la puissance prédictive.
Mauvaise réponse. Si vous utilisez un grand nombre de caractéristiques, même avec un modèle linéaire, le modèle qui en résulte est complexe et difficile à déboguer.

Références

En utilisant la régression avec la perte quadratique moyenne, vous prévoyez le coût d'une course en taxi en fonction de sa durée, de sa distance, de son point de départ et de sa fin. Vous savez:

  • Le prix moyen des courses est de 15 $.
  • Le coût du trajet augmente d'un montant fixe par kilomètre.
  • Les trajets dans le centre-ville sont payants.
  • Le prix de départ d'un trajet est de 3 $.

Déterminez si les références suivantes sont utiles.

Cette information est-elle utile: chaque trajet coûte 15 €.
Oui
Bonne réponse. Le coût moyen est une référence utile.
Non
Mauvaise réponse. La prédiction de la moyenne se traduit par une MSE plus faible que la prédiction d'une autre valeur. Par conséquent, le test d'un modèle par rapport à cette référence fournit une comparaison significative.
Cela dépend de l'écart type du coût du trajet.
Mauvaise réponse. Indépendamment de l'écart type, le coût moyen du trajet est une référence utile, car la prédiction de la moyenne se traduit toujours par une MSE plus faible que la prédiction d'autres valeurs.
Est-ce une référence ? Un modèle entraîné qui n'utilise que la durée et l'origine.
Oui
Mauvaise réponse. Vous ne devez utiliser un modèle entraîné comme référence qu'une fois qu'il a été entièrement validé en production. De plus, le modèle entraîné doit être validé par rapport à une référence plus simple.
Non
Bonne réponse. Vous ne devez utiliser un modèle entraîné comme référence qu'une fois qu'il a été entièrement validé en production.
Est-ce une référence utile ? Le coût d'une course correspond à la distance (en kilomètres) multipliée par le tarif au kilomètre.
Oui
Bonne réponse. La distance est le facteur le plus important pour déterminer le coût d'une course. Une référence basée sur la distance est donc utile.
Non
Mauvaise réponse. La distance est le facteur le plus important pour déterminer le coût du trajet. Une référence basée sur la distance est donc utile.
Cette information de référence est-elle utile: chaque trajet coûte 1 $. Parce que le modèle doit toujours dépasser cette référence. Si le modèle ne dépasse pas cette référence, nous pouvons en être certains.
Oui
Mauvaise réponse. Cette référence n'est pas utile, car elle est toujours incorrecte. Il n'est pas pertinent de comparer un modèle à une référence toujours incorrecte.
Non
Bonne réponse. Cette référence ne constitue pas un test utile de votre modèle.

Hyperparamètres

Les questions suivantes décrivent les problèmes liés à l'entraînement d'un classificateur. Choisissez les actions susceptibles de résoudre le problème décrit.

La perte d'entraînement est de 0,24 et la perte de validation est de 0,36. Parmi les actions suivantes, lesquelles pourraient réduire la différence entre la perte d'entraînement et la perte de validation ?
Assurez-vous que les ensembles d'entraînement et de validation ont les mêmes propriétés statistiques.
Bonne réponse. Si les ensembles d'entraînement et de validation présentent des propriétés statistiques différentes, les données d'entraînement ne permettent pas de prédire les données de validation.
Utilisez la régularisation pour éviter le surapprentissage.
Bonne réponse. Si la perte d'entraînement est inférieure à la perte de validation, votre modèle est probablement en surapprentissage par rapport aux données d'entraînement. La régularisation empêche le surapprentissage.
Augmentez le nombre d'époques d'entraînement.
Mauvaise réponse. Si la perte d'entraînement est inférieure à la perte de validation, votre modèle surapprend généralement les données d'entraînement. Augmenter les époques d'entraînement ne fera qu'augmenter le surapprentissage.
Réduire le taux d'apprentissage.
Mauvaise réponse. Une perte de validation supérieure à la perte d'entraînement indique généralement un surapprentissage. La modification du taux d'apprentissage ne permet pas de réduire le surapprentissage.
Vous effectuez les actions appropriées décrites dans la question précédente. Vos pertes d'entraînement et de validation diminuent alors de 1,0 à environ 0,24 après de nombreuses époques. Parmi les actions suivantes, laquelle peut réduire davantage votre perte d'entraînement ?
Augmentez la profondeur et la largeur de votre réseau de neurones.
Bonne réponse. Si votre perte d'entraînement reste constante à 0,24 après de nombreuses époques, votre modèle pourrait ne pas disposer de la capacité prédictive permettant de réduire davantage la perte. L'augmentation de la profondeur et de la largeur du modèle peut lui donner les capacités prédictives supplémentaires requises pour réduire davantage la perte d'entraînement.
Augmentez le nombre d'époques d'entraînement.
Mauvaise réponse. Si votre perte d'entraînement reste à 0,24 après de nombreuses époques, le fait de continuer à entraîner le modèle n'entraînera probablement pas une diminution importante de la perte d'entraînement.
Augmenter le taux d'apprentissage.
Mauvaise réponse. Étant donné que la perte d'entraînement n'a pas diminué pendant de nombreuses époques, l'augmentation du taux d'apprentissage ne devrait probablement pas diminuer la perte d'entraînement finale. L'augmentation du taux d'apprentissage peut rendre votre entraînement instable et empêcher votre modèle d'apprendre les données.
Vous devez répondre correctement à la question précédente. La perte d'entraînement de votre modèle est passée à 0,20. Supposons que vous deviez réduire un peu plus la perte d'entraînement de votre modèle. Vous ajoutez quelques caractéristiques qui semblent avoir une puissance prédictive. Cependant, la perte d'entraînement continue de fluctuer autour de 0,20. Parmi les options suivantes, lesquelles pourraient réduire votre perte d'entraînement ?
Augmentez la profondeur et la largeur de vos calques.
Bonne réponse. Votre modèle ne dispose peut-être pas de la capacité nécessaire pour apprendre les signaux prédictifs dans les nouvelles caractéristiques.
Augmenter les époques d'entraînement.
Mauvaise réponse. Si la perte d'entraînement de votre modèle fluctue autour de 0,20, l'augmentation du nombre d'époques d'entraînement entraînera probablement une fluctuation continue de la perte d'entraînement du modèle, aux alentours de 0,20.
Les éléments géographiques n'ajoutent aucune information sur les éléments existants. Essayez une autre fonctionnalité.
Bonne réponse. Il est possible que les signaux prédictifs encodés par les caractéristiques existent déjà dans les caractéristiques que vous utilisez.
Réduire le taux d'apprentissage.
Bonne réponse. Il est possible que l'ajout de nouvelles caractéristiques ait rendu le problème plus complexe. Plus précisément, la fluctuation de la perte indique que le taux d'apprentissage est trop élevé et que votre modèle saute autour des minimums. Diminuer votre taux d'apprentissage permettra à votre modèle d'apprendre les minimums.