Rodzaje warunków

W tej części omawiamy różne typy warunków wykorzystywanych przy podejmowaniu decyzji. drzew.

Warunki wyrównane do osi a warunki skośne

Warunek wyrównany do osi obejmuje tylko jedną cechę. Kąt skośny obejmuje wiele cech. Na przykład to jest warunek wyrównany do osi:

num_legs ≥ 2

Zakładamy przy tym warunek skośny:

num_legs ≥ num_fingers

Drzewa decyzyjne są często trenowane tylko przy użyciu warunków dopasowanych do osi. Pamiętaj jednak: Dzielenia skośne są skuteczniejsze, ponieważ mogą wyrażać bardziej złożone wzorów. Podziały skośne dają czasem lepsze wyniki kosztem i zwiększają koszty trenowania i wnioskowania.

Kod YDF
W YDF drzewa decyzyjne są domyślnie trenowane z uwzględnieniem warunku wyrównanego do osi. Możesz włączyć drzewa ukośne decyzji za pomocą funkcji split_axis="SPARSE_OBLIQUE".

Warunek wyrównany do osi to „liczba_legs >= 3”. Warunek pochylenia to
  „liczba_legów + waga * 5 >= 12”.

Rysunek 4. Przykłady warunku wyrównanego do osi i warunku skośnego. .

 

Narysowanie wykresu poprzednich 2 warunków dało następującą przestrzeń cech separacja:

Wykres wagi w porównaniu z liczbą_legów. Warunek wyrównany do osi nie
  ignoruje wagę, przez co jest tylko pionową linią. Kąt ukośny
  wskazuje linię o ujemnym nachyleniu.

Rysunek 5. Oddzielenie przestrzeni cech dla warunków na rysunku 4. .

 

Warunki binarne i niebinarne

Warunki z dwoma możliwymi wynikami (np. prawda lub fałsz) są nazywane warunków binarnych. Drzewa decyzyjne zawierające tylko warunki binarne tzw. binarnych drzew decyzyjnych.

Warunki niebinarne mogą mieć więcej niż dwa możliwe wyniki. Dlatego warunki niebinarne mają większą moc dyskryminacyjną niż warunki binarne. Decyzje, które zawierają co najmniej jeden warunek niebinarny, są nazywane decyzjami niebinarnymi drzewach.

Porównanie drzew decyzyjnych i niebinarnych. Decyzja binarna
  drzewo zawiera dwa warunki binarne; niebinarne drzewo decyzyjne
  zawiera jeden warunek niebinarny.

Rys. 6: Binarne a niebinarne drzewa decyzyjne. .

 

Za dużo warunków jest też większe prawdopodobieństwo nadmiernego dopasowania mocy elektrycznej. Z tego powodu lasy decyzyjne zazwyczaj używane są binarne drzewa decyzyjne, więc w tym kursie skupimy się właśnie na nich.

Najczęstszym typem warunku jest warunek progowy wyrażony jako:

featurethreshold

Na przykład:

num_legs ≥ 2

Mogą też występować inne typy warunków. Oto inne często używane typy warunki binarne:

 

Tabela 2. Typowe rodzaje warunków binarnych. .

Nazwa Warunek Przykład
warunek progu $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
warunek równości $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``kot"$
stan w zestawie $\mathrm{feature}_i \in \mathrm{kolekcja}$ $\mathrm{species} \in \{``kot", ``pies", ``ptak"\}$
warunek skośny $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ 5 USD \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10 USD
brak funkcji $\mathrm{feature}_i \mathrm{is} \mathrm{Brak}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Brak}$