Estudio detallado del AA: Regresión lineal

Hace mucho tiempo se sabe que los grillos (una especie de insecto) cantan con más frecuencias en los días de más calor. Durante décadas, científicos profesionales y aficionados han catalogado datos sobre cantos por minuto y temperatura. Como regalo de cumpleaños, tu tía Ruth te da su base de datos de críquet y te pide que aprendas un modelo para predecir esta relación. Con estos datos, desea explorar esta relación.

Primero, examina tus datos mediante un trazado:

Datos sin procesar de los cantos por minuto (eje x) en comparación con la temperatura (eje y).

Figura 1 Cantos por minuto contra temperatura en grados Celsius

Como era de esperar, la representación muestra que la cantidad de cantos aumenta. ¿Es lineal la relación entre los cantos y la temperatura? Sí, puedes dibujar una línea recta como la siguiente para aproximar esta relación:

Mejor línea que establece la relación entre los cantos por minuto (eje x) en comparación con la temperatura (eje y).

Figura 2: Una relación lineal.

Si bien la línea no atraviesa todos los puntos, muestra la relación entre los cantos y la temperatura. Si usas la ecuación para una línea, puedes anotar esta relación de la siguiente manera:

$$ y = mx + b $$

Donde:

  • \(y\) es la temperatura en Celsius, el valor que intentamos predecir.
  • \(m\) es la pendiente de la línea.
  • \(x\) es la cantidad de cantos por minuto, el valor de nuestro atributo de entrada.
  • \(b\) es la intersección en y.

Por convención en el aprendizaje automático, escribirás la ecuación de un modelo un poco diferente:

$$ y' = b + w_1x_1 $$

Donde:

  • \(y'\) es la etiqueta predicha (un resultado deseado).
  • \(b\) es el sesgo (la intersección en y), a veces denominado \(w_0\).
  • \(w_1\) es el peso del atributo 1. El peso es el mismo concepto que la pendiente \(m\) en la ecuación tradicional de una línea.
  • \(x_1\) es un atributo (una entrada conocida).

Para inferir (predecir) la temperatura \(y'\) para un nuevo valor de cantos por minuto \(x_1\), solo tienes que sustituir el valor \(x_1\) en este modelo.

Aunque este modelo usa solo un atributo, un modelo más sofisticado podría basarse en varios atributos, cada uno con un peso diferente (\(w_1\), \(w_2\), etc.). Por ejemplo, un modelo que se basa en tres atributos podría verse de la siguiente manera:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$