Spadek do ML: regresja liniowa

Od dawna wiadomo, że krykiety (gatunki owadów) częściej drążą w cieplejsze dni niż w chłodniejsze dni. Od dziesięcioleci zawodowi i amatorzy naukowcy zapisują dane o ruchach na minutę i temperaturze. W prezencie urodzinowa ciocia Ruth daje Ci bazę danych do krykieta i prosi Cię o nauczenie modelu przewidywania tej relacji. Korzystając z tych danych, chcesz zbadać tę relację.

Najpierw sprawdź swoje dane, nakreślając je:

Nieprzetworzone dane o gotach na minutę (oś X) w porównaniu z temperaturą (oś Y).

Rysunek 1. Chipsy na minutę a temperatura w stopniach Celsjusza.

Zgodnie z oczekiwaniami wykres pokazuje wzrost temperatury z liczbą cyfrów. Czy związek ten jest silniejszy? Tak, możesz narysować pojedynczą prostą linię, przybliżając tę relację:

Najwyższa linia rysująca/minuta (oś X) w porównaniu z temperaturą (oś Y).

Rysunek 2. Relacja liniowa.

To prawda, że linia nie przechodzi przez każdą kropkę, ale wyraźnie pokazuje zależność między cyplami a temperaturą. Za pomocą równania dla wiersza możesz zapisać tę relację w następujący sposób:

$$ y = mx + b $$

gdzie:

  • \(y\) to temperatura w stopniach Celsjusza – wartość, którą chcemy przewidzieć.
  • \(m\) to nachylenie prostej.
  • \(x\) to liczba sygnałów na minutę, czyli wartość naszej funkcji wejściowej.
  • \(b\) to punkt przecięcia z osią y.

Zgodnie z systemami uczącymi się formuła modelu różni się nieco od siebie:

$$ y' = b + w_1x_1 $$

gdzie:

  • \(y'\) to przewidywana etykieta (oczekiwana wartość wyjściowa).
  • \(b\) to odchylenia (Y – czasami nazywane \(w_0\)).
  • \(w_1\) to waga funkcji 1. Waga to to samo co &&tt;slope" \(m\) w tradycyjnym równaniu linii.
  • \(x_1\) to funkcja (znane dane wejściowe).

Aby prognozować temperaturę \(y'\) dla nowej wartości strzału na minutę \(x_1\), po prostu wstaw \(x_1\) wartość do tego modelu.

Chociaż model ten korzysta tylko z jednej funkcji, bardziej wymagający model może polegać na wielu cechach, z których każda ma osobną wagę (\(w_1\), \(w_2\)itd.). Oto przykład modelu opartego na 3 funkcjach:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$