Se usó la API de Cloud Translation para traducir esta página.

Conjuntos de entrenamiento y prueba: Ejercicio de Playground

Conjuntos de entrenamiento y de prueba

Regresamos a Playground para experimentar con conjuntos de entrenamiento y prueba.

Haz clic en el ícono de signo más para recordar lo que significan los puntos anaranjados y azules.

En la visualización:

Cada punto azul significa un ejemplo de una clase de datos (por ejemplo, spam).
Cada punto naranja significa un ejemplo de otra clase de datos (por ejemplo, que no es spam).
El color de fondo representa la predicción del modelo de dónde se deben encontrar los ejemplos de ese color. Un fondo azul alrededor de un punto azul significa que el modelo predice ese ejemplo de forma correcta. Por el contrario, un fondo naranja alrededor de un punto azul significa que el modelo no predice ese ejemplo de forma correcta.

Este ejercicio proporciona un conjunto de prueba y un conjunto de entrenamiento, ambos extraídos del mismo conjunto de datos. De forma predeterminada, la visualización solo muestra el conjunto de entrenamiento. Si también quieres ver el conjunto de prueba, haz clic en la casilla de verificación Mostrar datos de prueba debajo de la visualización. En la visualización, ten en cuenta la siguiente distinción:

Los ejemplos de entrenamiento tienen un contorno blanco.
Los ejemplos de prueba tienen un contorno negro.

Tarea 1: Ejecuta Playground con la configuración dada de la siguiente manera:

Haz clic en el botón Ejecutar/Pausar:
Observa cómo cambian los valores de pérdida de prueba y pérdida de entrenamiento.
Cuando los valores de pérdida de prueba y pérdida de entrenamiento dejen de cambiar o solo cambien de vez en cuando, vuelve a presionar el botón Ejecutar/Pausar para pausar Playground.

Ten en cuenta el delta entre la pérdida de prueba y la pérdida de entrenamiento. Intentaremos reducir este delta en las siguientes tareas.

Tarea 2: Haz lo siguiente:

Presiona el botón Restablecer.
Modifica la tasa de aprendizaje.
Presiona el botón Ejecutar/Pausar:
Permite que Playground ejecute al menos 150 ciclos de entrenamiento.

¿El delta entre la pérdida de prueba y la pérdida de entrenamiento es menor o mayor con esta nueva tasa de aprendizaje? ¿Qué sucede si modificas tanto la tasa de aprendizaje como el tamaño del lote?

Tarea 3 (opcional): El control deslizante con el nombre Porcentaje de datos de entrenamiento te permite controlar la proporción de datos de entrenamiento con respecto a los datos de prueba. Por ejemplo, cuando se establece en 90%, el 90% de los datos se usa para el conjunto de entrenamiento y el 10% restante se usa para el conjunto de prueba.

Puedes hacer lo siguiente:

Reduce el “Porcentaje de datos de entrenamiento” de 50% a 10%.
Experimenta con la tasa de aprendizaje y el tamaño del lote y toma notas sobre los hallazgos.

¿Alterar el porcentaje de datos de entrenamiento cambia la configuración de aprendizaje óptima que descubriste en la Tarea 2? Si es así, ¿por qué?

Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 1.

Con la tasa de aprendizaje establecida en 3 (configuración inicial), la pérdida de prueba es significativamente mayor que la pérdida de entrenamiento.

Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 2.

Cuando se reduce la tasa de aprendizaje (por ejemplo, a 0.001), la pérdida de prueba se reduce a un valor mucho más cercano al de la pérdida de entrenamiento. En la mayoría de las ejecuciones, aumentar el tamaño del lote no afecta la pérdida de entrenamiento ni la pérdida de prueba de manera significativa. Sin embargo, en un porcentaje pequeño de ejecuciones, aumentar el tamaño del lote a 20 o más provoca que la pérdida de prueba quede ligeramente por debajo de la pérdida de entrenamiento.

Los conjuntos de datos de Playground se generan de forma aleatoria. En consecuencia, es posible que nuestras respuestas no siempre coincidan exactamente con las tuyas.

Haz clic en el ícono de signo más para obtener la respuesta de la Tarea 3.

Reducir el porcentaje de datos de entrenamiento del 50% al 10% reduce drásticamente la cantidad de datos en el conjunto de entrenamiento. Con tan pocos datos, un gran tamaño del lote y una alta tasa de aprendizaje hacen que el modelo de entrenamiento salte de un lado a otro de manera caótica (de forma repetitiva en el punto mínimo).

Dividir datos

Comprueba tu intuición