Klasyfikacja: progowanie

Regresja logistyczna zwraca prawdopodobieństwo. Możesz użyć prawdopodobieństwa zwróconego w postaci prawdopodobieństwa w postaci „takiej, w jakiej jest” (np.prawdopodobieństwo, że użytkownik kliknie tę reklamę) lub zmienić prawdopodobieństwo zwrócone na wartość binarną (na przykład ten e-mail jest spamem).

Model regresji logistycznej, który zwraca wartość 0,9995 w przypadku określonego e-maila, przewiduje, że jest to spam. Natomiast inny e-mail z wynikiem prognozy 0,0003 w tym samym modelu regresji logistycznej najprawdopodobniej nie zawiera spamu. Ale co z e-mailem z wynikiem prognozy na poziomie 0, 6? Aby zmapować wartość regresji logistycznej na kategorię binarną, musisz zdefiniować próg klasyfikacji (nazywany też progiem decyzji). Wartość powyżej tego progu oznacza &&tt;spam" wartość poniżej oznacza &nie spam." Progi przyzwoite zakładają, że próg klasyfikacji powinien zawsze być równy 0,5, ale są one zależne od problemu i dlatego należy je dostosować.

W kolejnych sekcjach znajdziesz bliższe dane, które możesz wykorzystać do oceny modelu klasyfikacji i wpływu zmiany progu klasyfikacji na te prognozy.