Há muito tempo, sabe-se que os críquetes (uma espécie de inseto) chiram com mais frequência em dias mais quentes do que em dias mais frios. Por décadas, cientistas profissionais e amadores catalogam dados em chirps por minuto e temperatura. Como um presente de aniversário, sua tia Ruth oferece a ela um banco de dados de críquete e pede que você aprenda um modelo para prever esse relacionamento. Usando esses dados, você quer explorar essa relação.
Primeiro, examine os dados traçando-os:
Figura 1. Chirps por minuto x temperatura em Celsius.
Como esperado, o gráfico mostra a temperatura crescente com o número de toques. Esta relação entre chirps e temperatura linear? Sim, é possível desenhar uma única linha reta como a seguinte para aproximar essa relação:
Figura 2. Uma relação linear.
Verdadeiro, a linha não passa por todos os pontos, mas ela mostra claramente a relação entre chirps e temperatura. Usando a equação de uma linha, é possível escrever essa relação da seguinte maneira:
onde:
- \(y\) é a temperatura em Celsius, o valor que estamos tentando prever.
- \(m\) é a inclinação da linha.
- \(x\) é o número de toques por minuto, que é o valor do atributo de entrada.
- \(b\) é a interseção em y.
Por convenção em machine learning, você escreverá a equação para um modelo um pouco diferente:
onde:
- \(y'\) é o rótulo previsto (uma saída esperada).
- \(b\) é o viés (a interseção em y), às vezes chamado de \(w_0\).
- \(w_1\) é o peso do atributo 1. Peso é o mesmo conceito da "inclinação" \(m\) na equação tradicional de uma linha.
- \(x_1\) é um recurso (uma entrada conhecida).
Para inferir (prever) a temperatura \(y'\) por um novo valor de Chips por minuto \(x_1\), basta substituir o valor \(x_1\) no modelo.
Embora esse modelo use apenas um recurso, um modelo mais sofisticado pode depender de vários atributos, cada um com um peso separado (\(w_1\), \(w_2\)etc.). Por exemplo, um modelo que depende de três recursos pode ter a seguinte aparência: