En agosto de 2024, se lanzará una versión nueva y mejorada del Curso intensivo de aprendizaje automático. ¡No te pierdas ninguna novedad!

Se usó la API de Cloud Translation para traducir esta página.

Reducción de la pérdida: Ejercicio de Playground

Tasa de aprendizaje y convergencia

Este es el primero de varios ejercicios de Playground. Playground, un programa desarrollado específicamente para este curso para enseñar los principios del aprendizaje automático. Cada ejercicio de Playground de este curso incluye una instancia de Playground incorporada con ajustes predeterminados.

Cada ejercicio de Playground genera un conjunto de datos. La etiqueta de este conjunto de datos tiene dos valores posibles. Puedes pensar en esos dos valores posibles como spam frente a no spam o tal vez árboles sanos frente a árboles enfermos. El objetivo de la mayoría de los ejercicios es ajustar varios hiperparámetros para compilar un modelo que clasifique correctamente (separe o distinga) el valor de una etiqueta del otro. Ten en cuenta que la mayoría de los conjuntos de datos contienen una cierta cantidad de ruido, lo que hace imposible clasificar correctamente todos los ejemplos.

Haz clic en el ícono de signo más para obtener una explicación de la visualización del modelo.

Cada ejercicio de Playground muestra una visualización del estado actual del modelo. Por ejemplo, aquí hay una visualización:

Ten en cuenta lo siguiente sobre la visualización del modelo:

Cada eje representa un atributo específico. En el caso de "es spam" y "no es spam", los atributos pueden ser el recuento de palabras y la cantidad de destinatarios del correo electrónico.
Nota: Los valores apropiados de los ejes dependerán de los datos de los atributos. Los valores de los ejes que se muestran arriba no tendrían sentido para el recuento de palabras o la cantidad de destinatarios, ya que ninguno puede ser negativo.
Cada punto representa los valores de los atributos de un ejemplo de los datos, como un correo electrónico.
El color del punto representa la clase a la que pertenece el ejemplo. Por ejemplo, los puntos azules pueden representar los correos electrónicos que no son spam, mientras que los puntos anaranjados pueden representar aquellos que sí lo son.
El color de fondo representa la predicción del modelo de dónde se deben encontrar los ejemplos de ese color. Un fondo azul alrededor de un punto azul significa que el modelo predice ese ejemplo de forma correcta. Por el contrario, un fondo naranja alrededor de un punto azul significa que el modelo no está prediciendo correctamente ese ejemplo.
Los fondos azules y anaranjados están en escala. Por ejemplo, el lado izquierdo de la visualización es azul constante, pero se atenúa gradualmente a blanco en el centro de la visualización. Puedes pensar en la intensidad del color como una sugerencia de la confianza del modelo en su suposición. Por lo tanto, azul continuo significa que el modelo está muy seguro de su suposición y celeste significa que el modelo tiene menos confianza. (La visualización del modelo que se muestra en la figura realiza un mal trabajo de predicción).

Usa la visualización para evaluar el progreso de tu modelo. ("Excelente: la mayoría de los puntos azules tienen un fondo azul" o "¡Oh, no! Los puntos azules tienen un fondo naranja"). Más allá de los colores, Playground también muestra la pérdida actual del modelo de forma numérica. ("¡Oh, no! La pérdida está aumentando en lugar de bajando").

La interfaz de este ejercicio proporciona tres botones:

Ícono	Nombre	Qué hace
	Restablecer	Restablece las `iteraciones` a 0. Restablece los pesos que el modelo ya había aprendido.
	Step	Avanza una iteración. Con cada iteración, el modelo cambia, a veces de forma sutil y otras de forma drástica.
	Volver a generar	Genera un nuevo conjunto de datos. No restablece las `iteraciones`.

En este primer ejercicio de Playground, realizarás dos tareas para experimentar con la tasa de aprendizaje.

Tarea 1: Observa el menú de la tasa de aprendizaje que se encuentra en la parte superior derecha de Playground. La tasa de aprendizaje proporcionada (3) es muy alta. Para observar cómo esa tasa de aprendizaje alta afecta a tu modelo, haz clic en el botón “Paso” 10 o 20 veces. Después de cada iteración inicial, observa cómo la visualización del modelo cambia drásticamente. Incluso es posible que veas inestabilidad después de que el modelo parezca haber convergido. Además, observa las líneas que se extienden de x₁ y x₂ en la visualización del modelo. Los pesos de estas líneas indican los pesos de esos atributos en el modelo. Es decir, una línea gruesa indica un peso alto.

Tarea 2: Haz lo siguiente:

Presiona el botón Restablecer.
Reduce la tasa de aprendizaje.
Presiona el botón Paso reiteradas veces.

¿De qué manera la reducción en la tasa de aprendizaje afectó la convergencia? Examina la cantidad de pasos necesarios para que el modelo converja y también la fluidez y la constancia de la convergencia del modelo. Experimenta con valores aún más bajos de la tasa de aprendizaje. ¿Consideras que una tasa de aprendizaje es demasiado lenta como para ser útil? (encontrarás un debate justo debajo del ejercicio).

Haz clic en el ícono de signo más para ver un debate sobre la Tarea 2.

Debido a la naturaleza no determinista de los ejercicios de Playground, no siempre podemos proporcionar respuestas que correspondan exactamente con tu conjunto de datos. Dicho esto, una tasa de aprendizaje de 0.1 realiza una convergencia eficaz para nosotros. Las tasas de aprendizaje más pequeñas tardaron mucho más en converger; es decir, las tasas de aprendizaje más pequeñas fueron demasiado lentas para ser útiles.

Descenso de gradientes estocástico

Comprueba tu comprensión