Ensemble de validation

Le partitionnement d'un ensemble de données en un ensemble d'entraînement et un ensemble de test vous permet de déterminer si un modèle donné peut bien être généralisé aux nouvelles données. Toutefois, l'utilisation de deux partitions peut s'avérer insuffisante lorsque vous effectuez de nombreux cycles de réglages d'hyperparamètres.

Validation

Schéma d'un workflow composé de trois étapes. 1. Entraînez le modèle sur l'ensemble d'entraînement. 2. Évaluer le modèle sur l'ensemble de test 3. Ajustez le modèle en fonction des résultats obtenus avec l'ensemble de test. Effectuez des itérations sur les points 1, 2 et 3, afin de choisir le modèle qui a obtenu les meilleurs résultats avec l'ensemble de test.
Barre horizontale divisée en trois parties: 70% pour l'ensemble d'entraînement, 15% pour l'ensemble de validation et 15% pour l'ensemble de test
Workflow semblable à la figure 1, à la différence qu'au lieu d'évaluer le modèle avec l'ensemble de test, il est évalué avec l'ensemble de validation. Ensuite, une fois que les ensembles d'entraînement et de validation sont plus ou moins d'accord, confirmez le modèle par rapport à l'ensemble de test.