Une nouvelle version améliorée du cours d'initiation au machine learning sera disponible en août 2024. Tenez-vous informé !
Ensembles d'entraînement et de test
Nous revenons sur Playground pour mieux comprendre les ensembles d'entraînement et d'évaluation.
Cliquez sur l'icône Plus pour un rappel sur la signification des points orange et bleus.
Dans la visualisation:
- Chaque point bleu représente un exemple d'une classe de données (comme le spam).
- Chaque point orange correspond à un exemple d'une autre classe de données (par exemple, non-spam).
- La couleur d'arrière-plan représente la prédiction du modèle concernant l'emplacement des exemples de cette couleur. Un point bleu sur un arrière-plan bleu
signifie que le modèle prédit correctement cet exemple. À l'inverse,
un point bleu sur fond orange signifie que la prédiction effectuée
par le modèle est incorrecte pour cet exemple.
Cet exercice fournit un ensemble de test et un ensemble d'entraînement, tous deux issus du même ensemble de données. Par défaut, la visualisation n'affiche que l'ensemble d'entraînement. Si vous souhaitez également voir l'ensemble de test, cochez la case Show test data (Afficher les données de test) située sous la visualisation. Dans la visualisation, notez la distinction suivante:
- Les exemples d'entraînement ont des contours blancs.
- Les exemples de test ont un contour noir.
Tâche 1:exécutez Playground avec les paramètres fournis en procédant comme suit:
- Cliquez sur le bouton Lecture/Pause:
- Observez l'évolution des valeurs de la perte d'évaluation et de la perte d'entraînement.
- Lorsque les valeurs de la perte de test et de la perte d'entraînement cessent de changer ou ne changent qu'une seule fois, appuyez à nouveau sur le bouton Lecture/Pause pour mettre en pause Playground.
Notez le delta entre la perte d'évaluation et la perte d'entraînement. Nous allons essayer de réduire ce
delta dans les tâches suivantes.
Tâche 2:procédez comme suit:
- Appuyez sur le bouton Réinitialiser.
- Modifiez le taux d'apprentissage.
- Appuyez sur le bouton Lecture/Pause:
- Laissez Playground s'exécuter pendant au moins 150 époques.
Le delta entre la perte d'évaluation et la perte d'entraînement est-il plus bas ou
plus élevé avec ce nouveau taux d'apprentissage ? Que se passe-t-il si vous modifiez à la fois le taux d'apprentissage et la taille de lot ?
Tâche 3 (facultative):un curseur intitulé Training dataPercentage (Pourcentage de données d'entraînement) vous permet de contrôler la proportion de données d'entraînement par rapport aux données de test. Par exemple, si la valeur est de 90%, 90% des données sont utilisés pour l'ensemble d'entraînement et les 10% restants pour l'ensemble de test.
Procédez comme suit :
- Réduisez le "Pourcentage de données d'entraînement" de 50% à 10%.
- Testez le taux d'apprentissage et la taille de lot, et prenez note de vos résultats.
La modification du pourcentage de données d'entraînement modifie-t-elle les paramètres d'apprentissage optimaux découverts lors de la tâche 2 ? Si oui, pourquoi ?
Cliquez sur l'icône plus pour la réponse à la tâche 1.
Avec le taux d'apprentissage défini sur 3 (paramètre initial), la perte de test est considérablement plus élevée que la perte d'entraînement.
Cliquez sur l'icône Plus pour obtenir la réponse à la tâche 2.
Lorsque le taux d'apprentissage est réduit (en passant par exemple à 0, 001), la perte de test diminue et se rapproche de la perte d'entraînement. Dans la plupart des exécutions, l'augmentation de la taille de lot n'a pas d'incidence significative sur la perte d'entraînement ni la perte de test. Toutefois, dans un faible pourcentage d'exécutions, l'augmentation de la taille de lot à une valeur de 20 ou plus entraîne une baisse de la perte de test légèrement inférieure à la perte d'entraînement.
Les ensembles de données de Playground sont générés de manière aléatoire. Par conséquent, il est possible que nos réponses ne correspondent pas toujours exactement aux vôtres.
Cliquez sur l'icône Plus pour la réponse à la tâche 3.
Lorsque le pourcentage des données d'entraînement passe de 50% à 10 %, le nombre de points de données dans l'ensemble d'entraînement est considérablement réduit. Avec si peu de données, une taille de lot élevée et un taux d'apprentissage élevé font que le modèle d'entraînement saute de manière désordonnée (sautant à plusieurs reprises le point minimal).