Regresja logistyczna

Zamiast przewidywania dokładnie 0 lub 1, regresja logistyczna generuje prawdopodobieństwo – o wartości między 0 a 1 (wyłącznie). Rozważ na przykład model regresji logistycznej do wykrywania spamu. Jeśli model przyjmuje wartość 0,932 w przypadku określonego e-maila, oznacza to, że prawdopodobieństwo 93,2% wskazuje, że e-mail jest spamem. Mówiąc dokładniej, oznacza to, że w ramach limitu nieskończonych przykładów treningowych model, który przewiduje, że model będzie mieć wartość 0,932, będzie w 93,2% przypadków, a pozostałe 6,8% nie.

Regresja logistyczna

  • Wyobraź sobie problem przewidywania prawdopodobieństwa głowicy do wygiętych monet
  • Możesz użyć takich funkcji jak kąt wyginięcia, masa monet itp.
  • Jakiego prostego modelu możesz użyć?
  • Co może pójść nie tak?
Zginane 2 monety
  • Wiele problemów wymaga podania wartości szacunkowej jako danych wyjściowych
  • Wpisz regresję logiczną.
  • Wiele problemów wymaga podania wartości szacunkowej jako danych wyjściowych
  • Wpisz regresję logiczną.
  • Przydatne, ponieważ szacunkowe prawdopodobieństwo jest skalibrowane
    • np. p(domowa sprzedaż) * cena = oczekiwany wynik
  • Wiele problemów wymaga podania wartości szacunkowej jako danych wyjściowych
  • Wpisz regresję logiczną.
  • Przydatne, ponieważ szacunkowe prawdopodobieństwo jest skalibrowane
    • np. p(domowa sprzedaż) * cena = oczekiwany wynik
  • Przydaje się też, gdy klasyfikacja binarna jest potrzebna.
    • czy nie spam? → p(Spam)

$$ y' = \frac{1}{1 + e^{-(w^Tx+b)}} $$

\(\text{Where:} \) \(x\text{: Provides the familiar linear model}\) \(1+e^{-(...)}\text{: Squish through a sigmoid}\)

Wykres równania regresji logistycznej

$$ LogLoss = \sum_{(x,y)\in D} -y\,log(y') - (1 - y)\,log(1 - y') $$

2 wykresy Strata vs. Przewidywana wartość: 1 z wartością docelową 0,0 (AR a góra i prawo) i 1 (wartość docelowa 1,0 (AR) w dół i w lewo)
  • Regularność regresji jest bardzo ważna dla regresji logicznej.
    • Zapamiętaj asymptoty
    • Nadal będzie dążyć do utraty strat do 0 w wysokich wymiarach
  • Regularność regresji jest bardzo ważna dla regresji logicznej.
    • Zapamiętaj asymptoty
    • Nadal będzie dążyć do utraty strat do 0 w wysokich wymiarach
  • Szczególnie przydatne są dwie strategie:
    • Zwalczanie wagi 2 (tzw. spadek wagi L2) – wprowadza kary.
    • Wcześniejsze zatrzymywanie – ograniczanie kroków treningowych lub współczynnika uczenia się.
  • Regresja liniowa logistyczna jest bardzo skuteczna.
    • Bardzo szybkie czasy trenowania i prognozowania.
    • Krótkie / szerokie modele wykorzystują dużo pamięci RAM.