Conjuntos de entrenamiento y prueba: Ejercicio de Playground

Conjuntos de entrenamiento y de prueba

Regresamos a Playground para experimentar con conjuntos de entrenamiento y prueba.

Este ejercicio proporciona un conjunto de prueba y un conjunto de entrenamiento, ambos extraídos del mismo conjunto de datos. De forma predeterminada, la visualización solo muestra el conjunto de entrenamiento. Si también quieres ver el conjunto de prueba, haz clic en la casilla de verificación Mostrar datos de prueba debajo de la visualización. En la visualización, ten en cuenta la siguiente distinción:

  • Los ejemplos de entrenamiento tienen un contorno blanco.
  • Los ejemplos de prueba tienen un contorno negro.

Tarea 1: Ejecuta Playground con la configuración dada de la siguiente manera:

  1. Haz clic en el botón Ejecutar/Pausar:
  2. Observa cómo cambian los valores de pérdida de prueba y pérdida de entrenamiento.
  3. Cuando los valores de pérdida de prueba y pérdida de entrenamiento dejen de cambiar o solo cambien de vez en cuando, vuelve a presionar el botón Ejecutar/Pausar para pausar Playground.
Ten en cuenta el delta entre la pérdida de prueba y la pérdida de entrenamiento. Intentaremos reducir este delta en las siguientes tareas.

Tarea 2: Haz lo siguiente:

  1. Presiona el botón Restablecer.
  2. Modifica la tasa de aprendizaje.
  3. Presiona el botón Ejecutar/Pausar:
  4. Permite que Playground ejecute al menos 150 ciclos de entrenamiento.

¿El delta entre la pérdida de prueba y la pérdida de entrenamiento es menor o mayor con esta nueva tasa de aprendizaje? ¿Qué sucede si modificas tanto la tasa de aprendizaje como el tamaño del lote?

Tarea 3 (opcional): El control deslizante con el nombre Porcentaje de datos de entrenamiento te permite controlar la proporción de datos de entrenamiento con respecto a los datos de prueba. Por ejemplo, cuando se establece en 90%, el 90% de los datos se usa para el conjunto de entrenamiento y el 10% restante se usa para el conjunto de prueba.

Puedes hacer lo siguiente:

  1. Reduce el “Porcentaje de datos de entrenamiento” de 50% a 10%.
  2. Experimenta con la tasa de aprendizaje y el tamaño del lote y toma notas sobre los hallazgos.
¿Alterar el porcentaje de datos de entrenamiento cambia la configuración de aprendizaje óptima que descubriste en la Tarea 2? Si es así, ¿por qué?