Le machine learning serait très facile si toutes nos courbes de perte se présentaient comme suit la première fois que nous avons entraîné notre modèle:
En réalité, les courbes de fonction de perte peuvent être assez difficiles à interpréter. Utilisez vos connaissances sur les courbes de fonction de perte pour répondre aux questions suivantes.
1. Mon modèle ne sera pas entraîné !
Votre ami Mel et vous continuez à travailler sur un prédicteur d'apparence de licorne.
Voici votre première courbe de fonction de perte.
Décrivez le problème et la façon dont Mel pourrait le résoudre :
Cliquez sur l'icône Plus pour développer la section et afficher la réponse.
Votre modèle ne converge pas. Suivez ces étapes de débogage:
Vérifiez si vos caractéristiques peuvent prédire les étiquettes en suivant les étapes de débogage du modèle.
Comparez vos données à un schéma de données pour détecter les mauvais exemples.
Si l'entraînement semble instable, comme dans ce graphique, réduisez votre taux d'apprentissage pour empêcher le modèle de rebondir dans l'espace des paramètres.
Simplifiez votre ensemble de données en choisissant 10 exemples dont votre modèle peut s'appuyer sur vos prédictions. Obtenez une perte très faible sur l'ensemble de données réduit. Continuez ensuite à déboguer votre modèle sur l'ensemble de données complet.
Simplifiez votre modèle et assurez-vous qu'il est plus performant que votre référence. Ensuite, complexifiez progressivement le modèle.
2. Ma perte a explosé !
Mel vous montre une autre courbe. Quel est le problème et comment peut-elle y remédier ?
Rédigez votre réponse ci-dessous.
Cliquez sur l'icône Plus pour développer la section et afficher la réponse.
Une augmentation importante de la perte est généralement due à des valeurs anormales dans les données d'entrée. Causes possibles :
NaN dans les données d'entrée.
Gradient exponentiel en raison de données anormales.
Diviser par zéro.
Logarithme de zéros ou de nombres négatifs.
Pour corriger une perte exponentielle, recherchez les données anormales dans vos lots et vos données techniques. Si l'anomalie semble poser problème, examinez-en la cause. Sinon, si l'anomalie ressemble à des données aberrantes, assurez-vous que les anomalies sont réparties uniformément entre les lots en brassant les données.
3. Mes métriques sont contradictoires !
Melissa veut prendre une autre courbe. Que se passe-t-il
et comment peut-elle y remédier ? Rédigez votre réponse ci-dessous.
Décrivez le problème et la façon dont Mel pourrait le résoudre :
Cliquez sur l'icône Plus pour développer la section et afficher la réponse.
Le rappel est bloqué à 0, car la probabilité de classification de vos exemples n'est jamais supérieure au seuil de classification positive. Cette situation se produit souvent avec des problèmes de déséquilibre de classe important. N'oubliez pas que les bibliothèques de ML, telles que TF Keras, utilisent généralement un seuil par défaut de 0,5 pour calculer les métriques de classification.
Suivez ces étapes:
Réduisez votre seuil de classification.
Vérifiez les métriques de non-variantes de seuil, telles que l'AUC.
4. La perte d'évaluation est trop forte !
Mel vous montre les courbes de fonction de perte pour les ensembles de données d'entraînement et de test et demande "Quel est le problème ?" Écrivez votre réponse ci-dessous.
Décrivez le problème et la façon dont Mel pourrait le résoudre :
Cliquez sur l'icône Plus pour développer la section et afficher la réponse.
Votre modèle surapprend les données d'entraînement. Suivez les étapes ci-dessous :
Réduire la capacité du modèle
Ajouter une régularisation.
Vérifiez que les divisions d'entraînement et de test sont statistiquement équivalentes.
5. Mon modèle est bloqué
Vous êtes patient lorsque Mel est de retour quelques jours plus tard avec une autre courbe. Quel est le problème et comment Mel peut-il y remédier ?
Décrivez le problème et la façon dont Mel pourrait le résoudre :
Cliquez sur l'icône Plus pour développer la section et afficher la réponse.
Votre perte montre un comportement répétitif et semblable à un pas. Il est probable que les données d'entrée vues par votre modèle présentent elles-mêmes des comportements répétitifs. Assurez-vous que le brassage supprime le comportement répétitif des données d'entrée.
Cela fonctionne !
"Ça fonctionne parfaitement maintenant !" s'exclame Mel. Elle s'appuie sur sa chaise
de façon mélancolique et soupire un grand soupir. La courbe est magnifique et vous obtenez
un résultat positif. Vous prenez le temps de discuter des vérifications supplémentaires suivantes pour valider votre modèle.
métriques réelles
références
perte absolue pour les problèmes de régression
Autres métriques pour les problèmes de classification
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.