Redução no ML: regressão linear

Há muito tempo, sabe-se que os críquetes (uma espécie de inseto) chiram com mais frequência em dias mais quentes do que em dias mais frios. Por décadas, cientistas profissionais e amadores catalogam dados em chirps por minuto e temperatura. Como um presente de aniversário, sua tia Ruth oferece a ela um banco de dados de críquete e pede que você aprenda um modelo para prever esse relacionamento. Usando esses dados, você quer explorar essa relação.

Primeiro, examine os dados traçando-os:

Dados brutos de chirps/minuto (eixo X) x temperatura (eixo y).

Figura 1. Chirps por minuto x temperatura em Celsius.

Como esperado, o gráfico mostra a temperatura crescente com o número de toques. Esta relação entre chirps e temperatura linear? Sim, é possível desenhar uma única linha reta como a seguinte para aproximar essa relação:

A melhor linha que estabelece a relação de chirps/minuto (eixo X) x temperatura (eixo y).

Figura 2. Uma relação linear.

Verdadeiro, a linha não passa por todos os pontos, mas ela mostra claramente a relação entre chirps e temperatura. Usando a equação de uma linha, é possível escrever essa relação da seguinte maneira:

$$ y = mx + b $$

onde:

  • \(y\) é a temperatura em Celsius, o valor que estamos tentando prever.
  • \(m\) é a inclinação da linha.
  • \(x\) é o número de toques por minuto, que é o valor do atributo de entrada.
  • \(b\) é a interseção em y.

Por convenção em machine learning, você escreverá a equação para um modelo um pouco diferente:

$$ y' = b + w_1x_1 $$

onde:

  • \(y'\) é o rótulo previsto (uma saída esperada).
  • \(b\) é o viés (a interseção em y), às vezes chamado de \(w_0\).
  • \(w_1\) é o peso do atributo 1. Peso é o mesmo conceito da "inclinação" \(m\) na equação tradicional de uma linha.
  • \(x_1\) é um recurso (uma entrada conhecida).

Para inferir (prever) a temperatura \(y'\) por um novo valor de Chips por minuto \(x_1\), basta substituir o valor \(x_1\) no modelo.

Embora esse modelo use apenas um recurso, um modelo mais sofisticado pode depender de vários atributos, cada um com um peso separado (\(w_1\), \(w_2\)etc.). Por exemplo, um modelo que depende de três recursos pode ter a seguinte aparência:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$