Conjunto de validación

La partición de un conjunto de datos en un conjunto de entrenamiento y uno de prueba te permite juzgar si un modelo determinado generalizará bien sobre datos nuevos. Sin embargo, usar solo dos particiones puede no ser suficiente cuando se realizan muchas rondas de ajuste de hiperparámetros.

Validación

Un diagrama de flujo de trabajo que consta de tres etapas. 1. Entrenar el modelo con el conjunto de entrenamiento 2. Evaluar el modelo con el conjunto de prueba. 3. Ajustar el modelo en función de los resultados con el conjunto de prueba. Iterar sobre 1, 2 y 3, y finalmente eligiendo el modelo que mejor se desempeñe en el conjunto de prueba.
Barra horizontal dividida en tres partes: un 70% corresponde al conjunto de entrenamiento, un 15% corresponde al conjunto de validación y el otro 15%, el conjunto de prueba
Un flujo de trabajo similar al de la Figura 1, excepto que, en lugar de evaluar el modelo con el conjunto de prueba, el flujo de trabajo evalúa el modelo con el conjunto de validación. Luego, una vez que el conjunto de entrenamiento y el de validación coincidan más o menos, confirma el modelo con el conjunto de prueba.