Hace mucho tiempo se sabe que los grillos (una especie de insecto) cantan con más frecuencias en los días de más calor. Durante décadas, científicos profesionales y aficionados han catalogado datos sobre cantos por minuto y temperatura. Como regalo de cumpleaños, tu tía Ruth te da su base de datos de críquet y te pide que aprendas un modelo para predecir esta relación. Con estos datos, desea explorar esta relación.
Primero, examina tus datos mediante un trazado:
Figura 1 Cantos por minuto contra temperatura en grados Celsius
Como era de esperar, la representación muestra que la cantidad de cantos aumenta. ¿Es lineal la relación entre los cantos y la temperatura? Sí, puedes dibujar una línea recta como la siguiente para aproximar esta relación:
Figura 2: Una relación lineal.
Si bien la línea no atraviesa todos los puntos, muestra la relación entre los cantos y la temperatura. Si usas la ecuación para una línea, puedes anotar esta relación de la siguiente manera:
Donde:
- \(y\) es la temperatura en Celsius, el valor que intentamos predecir.
- \(m\) es la pendiente de la línea.
- \(x\) es la cantidad de cantos por minuto, el valor de nuestro atributo de entrada.
- \(b\) es la intersección en y.
Por convención en el aprendizaje automático, escribirás la ecuación de un modelo un poco diferente:
Donde:
- \(y'\) es la etiqueta predicha (un resultado deseado).
- \(b\) es el sesgo (la intersección en y), a veces denominado \(w_0\).
- \(w_1\) es el peso del atributo 1. El peso es el mismo concepto que la pendiente \(m\) en la ecuación tradicional de una línea.
- \(x_1\) es un atributo (una entrada conocida).
Para inferir (predecir) la temperatura \(y'\) para un nuevo valor de cantos por minuto \(x_1\), solo tienes que sustituir el valor \(x_1\) en este modelo.
Aunque este modelo usa solo un atributo, un modelo más sofisticado podría basarse en varios atributos, cada uno con un peso diferente (\(w_1\), \(w_2\), etc.). Por ejemplo, un modelo que se basa en tres atributos podría verse de la siguiente manera: