Ensembles d'entraînement et de test: exercice dans Playground

Ensembles d'entraînement et de test

Nous revenons sur Playground pour mieux comprendre les ensembles d'entraînement et d'évaluation.

Cet exercice fournit un ensemble de test et un ensemble d'entraînement, tous deux issus du même ensemble de données. Par défaut, la visualisation n'affiche que l'ensemble d'entraînement. Si vous souhaitez également voir l'ensemble de test, cochez la case Show test data (Afficher les données de test) située sous la visualisation. Dans la visualisation, notez la distinction suivante:

  • Les exemples d'entraînement ont des contours blancs.
  • Les exemples de test ont un contour noir.

Tâche 1:exécutez Playground avec les paramètres fournis en procédant comme suit:

  1. Cliquez sur le bouton Lecture/Pause:
  2. Observez l'évolution des valeurs de la perte d'évaluation et de la perte d'entraînement.
  3. Lorsque les valeurs de la perte de test et de la perte d'entraînement cessent de changer ou ne changent qu'une seule fois, appuyez à nouveau sur le bouton Lecture/Pause pour mettre en pause Playground.
Notez le delta entre la perte d'évaluation et la perte d'entraînement. Nous allons essayer de réduire ce delta dans les tâches suivantes.

Tâche 2:procédez comme suit:

  1. Appuyez sur le bouton Réinitialiser.
  2. Modifiez le taux d'apprentissage.
  3. Appuyez sur le bouton Lecture/Pause:
  4. Laissez Playground s'exécuter pendant au moins 150 époques.

Le delta entre la perte d'évaluation et la perte d'entraînement est-il plus bas ou plus élevé avec ce nouveau taux d'apprentissage ? Que se passe-t-il si vous modifiez à la fois le taux d'apprentissage et la taille de lot ?

Tâche 3 (facultative):un curseur intitulé Training dataPercentage (Pourcentage de données d'entraînement) vous permet de contrôler la proportion de données d'entraînement par rapport aux données de test. Par exemple, si la valeur est de 90%, 90% des données sont utilisés pour l'ensemble d'entraînement et les 10% restants pour l'ensemble de test.

Procédez comme suit :

  1. Réduisez le "Pourcentage de données d'entraînement" de 50% à 10%.
  2. Testez le taux d'apprentissage et la taille de lot, et prenez note de vos résultats.
La modification du pourcentage de données d'entraînement modifie-t-elle les paramètres d'apprentissage optimaux découverts lors de la tâche 2 ? Si oui, pourquoi ?