Ensembles d'entraînement et de test

Un ensemble de test est un ensemble de données utilisé pour évaluer le modèle développé à partir d'un ensemble d'entraînement.

Ensembles d'entraînement et de test

Barre horizontale divisée en deux parties: 80% pour l'ensemble d'entraînement et 20% pour l'ensemble d'évaluation.
Deux modèles: l'un s'exécute sur les données d'entraînement et l'autre sur les données de test.  Le modèle est très simple : il suffit d'une ligne séparant les points orange des points bleus.  La perte pour les données d'entraînement est semblable à la perte pour les données de test.
  • Divisez-le en deux ensembles:
    • Ensemble d'entraînement
    • Ensemble de test
  • Piège classique: n'entraînez pas l'entraînement sur des données de test.
    • Vous obtenez une perte étonnamment faible ?
    • Avant de vous féliciter, vérifiez si vous avez effectué accidentellement un entraînement sur des données de test