Progi i tabela pomyłek

Załóżmy, że masz model regresji logistycznej do wykrywania spamu i e-maili, prognozuje wartość z zakresu od 0 do 1, co przedstawia prawdopodobieństwo, że dana to spam. Prognoza na poziomie 0,50 oznacza 50% prawdopodobieństwa, że e-mail zostanie spam, szacunek 0,75 oznacza 75% prawdopodobieństwa, że e-mail to spam, i tak dalej.

Chcesz wdrożyć ten model w aplikacji poczty e-mail, aby filtrować spam w osobnym folderze poczty. Aby to zrobić, musisz przekonwertować nieprzetworzony format modelu dane wyjściowe liczbowe (np. 0.75) na jedną z dwóch kategorii: „spam” lub „nie spamu”.

Aby dokonać takiej konwersji, należy wybrać wartość progową prawdopodobieństwa, tzw. próg klasyfikacji. Następnie przypisujemy przykłady z prawdopodobieństwem powyżej wartości progowej. do klasy pozytywnej, zajęcia, na których testujesz (tutaj spam). Przykłady z niższą wartością prawdopodobieństwo jest przypisywane do klasy ujemnej, klasę alternatywną (tutaj: not spam).

Kliknij tutaj, aby dowiedzieć się więcej o progu klasyfikacji

Być może zastanawiasz się, co się stanie, gdy prognozowany wynik będzie taki sam próg klasyfikacji (na przykład wynik 0,5, gdzie próg klasyfikacji to też 0,5)? Obsługa tego zgłoszenia zależy od konkretnej implementacji wybranej do klasyfikacji model atrybucji. Na przykład Keras prognozuje klasę ujemną, jeśli wynik i próg są takie same, ale inne narzędzia/platformy mogą poradzić sobie w tym przypadku w inny sposób.

Na przykład załóżmy, że model zdobywa jeden e-mail jako 0,99, prognozując że ten e-mail jest na 99% szans na to, że jest spamem, 0,51, oznacza to 51% prawdopodobieństwa, że wiadomość będzie spamem. Jeśli ustawisz parametr próg klasyfikacji na 0,5, model sklasyfikuje oba e-maile jako spamu. Jeśli ustawisz próg na poziomie 0,95, tylko ocena e-mail 0,99 będzie nie zostały sklasyfikowane jako spam.

Choć próg 0,5 może wydawać się intuicyjny, nie jest dobrym pomysłem, koszt jednego typu błędnej klasyfikacji jest większy od drugiego lub klas są nierówne. Jeśli tylko 0, 01% e-maili to spam lub jeśli zostały przekazane w niewłaściwy sposób wiarygodne e-maile są gorsze niż wpuszczanie spamu do skrzynki odbiorczej, oznaczanie wszystkiego, co model uzna za co najmniej 50% prawdopodobieństwa, że jest spamem; ponieważ spam daje niepożądane rezultaty.

Tablica pomyłek

wynik prawdopodobieństwa nie jest rzeczywistością lub danych podstawowych. Każdy wynik działania klasyfikatora binarnego może przynieść 4 możliwe wyniki. W przypadku przykładowego klasyfikatora spamu: jeśli przedstawisz dane podstawowe jako kolumny a prognoza modelu w postaci wierszy, tabela poniżej nosi nazwę tablica pomyłek to wynik:

Rzeczywista wartość dodatnia Rzeczywista wartość ujemna
Prognoza dodatnia Prawdziwie pozytywne (TP): spam. e-maile zostały prawidłowo sklasyfikowane jako spam. To są wiadomości będące spamem które automatycznie trafią do folderu spamu. Fałszywie pozytywny wynik: e-mail niebędący spamem został błędnie sklasyfikowany jako spamu. Są to wiarygodne e-maile, trafiają do folderu ze spamem.
Prognozowana wartość ujemna Fałsz negatywne (FN): spamerskie e-maile błędnie sklasyfikowane jako niebędące spamem. To jest spam które nie są przez filtr spamu i przekazują się do skrzynki odbiorczej. Wynik prawdziwie negatywny (TN): A e-maile, które nie są spamem, zostały poprawnie sklasyfikowane jako niebędące spamem. To są prawidłowe e-maile, które są wysyłane prosto do skrzynki odbiorczej.

Zwróć uwagę, że suma w każdym wierszu to wszystkie prognozowane wartości dodatnie (TP + FP) oraz wszystkie prognozowane wartości ujemne (FN + TN), niezależnie od tego, czy są prawidłowe. Suma w każdej z kolei daje wszystkie wyniki prawdziwie dodatnie (TP + FN) i wszystkie liczby rzeczywiste negatywne (TP + FN) (FP + TN) niezależnie od klasyfikacji modelu.

Gdy łączna liczba rzeczywistych dodatnich nie jest zbliżona do sumy wartości rzeczywistych negatywów, zbiór danych jest niezrównoważony. Instancja niezrównoważonego zbioru danych może to być zbiór tysięcy zdjęć chmur, ten rzadki typ chmury, na przykład wolutusowe chmury, pojawia się tylko kilka razy.

Wpływ progu na wyniki prawdziwie i fałszywie pozytywne i negatywne

Różne progi zazwyczaj skutkują różną liczbą wartości prawda i fałsz wyniki dodatnie i prawda i fałszywie negatywne. Ten film wyjaśnia, dlaczego tak jest tę sprawę.

Spróbuj samodzielnie zmienić próg.

Ten widżet zawiera 3 zbiory danych zabawek:

  • Rozdzielone, gdzie przykłady pozytywne i negatywne są przeważnie bardzo zróżnicowane, przy czym większość pozytywnych ocen ma wyższe wyniki niż negatywnych przykładów.
  • Nierozdzielone, gdzie wiele przykładów pozytywnych ma niższe wyniki niż Przykłady negatywne, a wiele przykładów ujemnych ma wyższe wyniki niż pozytywnych przykładów.
  • Niezbalansowane – zawiera tylko kilka przykładów klasy pozytywnej.

Sprawdź swoją wiedzę

1. Wyobraź sobie model klasyfikacji phishingu lub złośliwego oprogramowania, w którym strony wyłudzające informacje i zawierające złośliwe oprogramowanie należą do klasy 1 (prawda) oraz nieszkodliwe strony należą do klasy 0 (fałsz). Ten model omyłkowo sklasyfikował prawdziwą witrynę jako złośliwe oprogramowanie. Jak się to nazywa?
Wynik fałszywie pozytywny
Przykład negatywny (prawidłowa witryna) został błędnie umieszczony został sklasyfikowany jako przykład pozytywny (strona ze złośliwym oprogramowaniem).
Wynik prawdziwie pozytywny
Strona prawdziwie pozytywne to takie, która zawiera złośliwe oprogramowanie sklasyfikowanych jako złośliwe oprogramowanie.
Wynik fałszywie negatywny
Wynik fałszywie negatywny to błędnie oznaczona witryna z wykorzystaniem złośliwego oprogramowania sklasyfikowanych jako wiarygodne.
Wynik prawdziwie negatywny
Wynik prawdziwie negatywny oznacza wiarygodną witrynę, sklasyfikowanych jako wiarygodne.
2. Ogólnie rzecz biorąc, co dzieje się z liczbą wyników fałszywie pozytywnych, gdy próg klasyfikacji wzrośnie? A co z wynikami prawdziwie pozytywnymi? Eksperyment za pomocą powyższego suwaka.
Zmniejsza się liczba wyników prawdziwie i fałszywie pozytywnych.
Gdy próg wzrośnie, model prawdopodobnie przewidzi, jest ogólnie mniej pozytywnych (prawda) i „false” (fałsz). Klasyfikator spamu z tagiem wynosi 0,9999, dzięki czemu e-mail zostanie oznaczony jako spam tylko wtedy, gdy uwzględni prawdopodobieństwo na poziomie co najmniej 99,99%, co oznacza, że jest wysokie raczej nie dochodzi do błędnego oznaczenia prawidłowego e-maila, ale też może przegapić spamu.
Liczba wyników prawdziwie i fałszywie pozytywnych wzrosła.
Za pomocą powyższego suwaka spróbuj ustawić próg na 0, 1, a potem przeciągnij ją do wartości 0,9. Co dzieje się z liczbą wyników fałszywie pozytywnych i prawdziwie pozytywnych wyników?
Wzrost wyników prawdziwie pozytywnych. Spadek liczby fałszywie pozytywnych.
Za pomocą powyższego suwaka spróbuj ustawić próg na 0, 1, a potem przeciągnij ją do wartości 0,9. Co dzieje się z liczbą wyników fałszywie pozytywnych i prawdziwie pozytywnych wyników?
3. Ogólnie rzecz biorąc, co dzieje się z liczbą wyników fałszywie negatywnych, gdy próg klasyfikacji wzrośnie? A co z wynikami prawdziwie negatywnymi? Eksperyment za pomocą powyższego suwaka.
Liczba wyników prawda i fałszywie negatywnych rośnie.
Gdy próg wzrośnie, model prawdopodobnie przewidzi, więcej wyników negatywnych (prawda i fałsz). Na bardzo wysokim progu prawie wszystkie e-maile, zarówno spam, jak i pozostałe wiadomości, zostaną sklasyfikowane jako spam.
Spadek liczby wyników prawda i fałszywie negatywnych się zmniejsza.
Za pomocą powyższego suwaka spróbuj ustawić próg na 0, 1, a potem przeciągnij ją do wartości 0,9. Co dzieje się z liczbą wyników fałszywie negatywnych i prawdziwie negatywne?
Wzrost wyników prawdziwie negatywnych. Spadek wyników fałszywie negatywnych.
Za pomocą powyższego suwaka spróbuj ustawić próg na 0, 1, a potem przeciągnij ją do wartości 0,9. Co dzieje się z liczbą wyników fałszywie negatywnych i prawdziwie negatywne?