Zmienne znaczenie
Zmienne znaczenie (nazywane też ważnością cech) to wynik, który wskazuje, jak „ważna” jest dana cecha dla modelu. Jeśli na przykład model ma dwie cechy wejściowe „f1” i „f2”, znaczenie zmiennej wynosi {f1=5,8, f2=2,5}, cecha „f1” jest dla modelu ważniejsza niż cecha „f2”. Podobnie jak w przypadku innych modeli systemów uczących się zmienne znaczenie pozwala łatwo zrozumieć, jak działa drzewo decyzyjne.
Do drzew decyzyjnych możesz stosować znaczenie zmiennych niezależnych od modelu, np. ważność zmiennych permutacji.
Drzewa decyzyjne mają też specyficzne zmienne znaczenie, na przykład:
- Suma wyniku podziału z daną zmienną.
- Liczba węzłów z daną zmienną.
- Średnia głębokość pierwszego wystąpienia cechy na wszystkich ścieżkach drzewa.
Znaczenie może być różne, na przykład:
- semantyka
- skala
- usługi
Ponadto zmienne ważności dostarczają różnego rodzaju informacji o:
- model
- zbiór danych
- proces trenowania
Na przykład liczba warunków zawierających konkretną cechę wskazuje, w jakim stopniu drzewo decyzyjne obejmuje tę konkretną cechę, co może wskazywać na zmienne znaczenie. Gdyby nie miało to znaczenia, algorytm uczenia nie użyłby danej funkcji w wielu warunkach. Jednak ta sama cecha występująca w wielu warunkach może też wskazywać, że model próbuje, ale nie uogólnia wzorca cechy. Na przykład może się tak zdarzyć, gdy cecha jest tylko przykładowym identyfikatorem bez informacji, które można uogólnić.
Z drugiej strony wysoka wartość zmiennej permutacji wskazuje, że usunięcie cechy szkodzi modelowi, co wskazuje na zmienną istotność. Jeśli jednak model jest solidny, usunięcie dowolnej cechy może nie uszkodzić modelu.
Różne zmienne znaczenia wpływają na różne aspekty modelu, więc przyjrzenie się kilku różnym czynnikom jednocześnie dostarcza informacji. Jeśli np. cecha jest ważna pod względem wszystkich znaczenia zmiennych, ta cecha jest prawdopodobnie ważna. Innym przykładem, jeśli cecha ma wysokie znaczenie zmiennej „liczby węzłów” i małe znaczenie zmiennej „permutacji”, uogólnienie tej cechy może być trudne i obniżyć jakość modelu.
model.describe()
i zaglądając na kartę „Znaczenie zmiennej”.
Więcej informacji znajdziesz w
samouczku rozumienia modeli.