Ta jednostka obejmuje różne typy conditions używanych do tworzenia drzew decyzyjnych.
Warunki wyrównane względem osi a warunki skośne
Warunek wyrównany do osi obejmuje tylko jedną cechę. Warunek ukośny obejmuje wiele cech. Na przykład taki warunek jest wyrównany do osi:
num_legs ≥ 2
Warunek skośny jest jednak taki:
num_legs ≥ num_fingers
Często drzewa decyzyjne są trenowane tylko za pomocą warunków wyrównanych do osi. Podziały ukośne są jednak skuteczniejsze, ponieważ mogą przedstawiać bardziej złożone wzorce. Podziały skośne czasem dają lepsze wyniki kosztem wyższych kosztów trenowania i wnioskowania.
split_axis="SPARSE_OBLIQUE"
.
Rysunek 4. Przykłady warunku wyrównanego do osi i warunku ukośnego.
Na wykresie 2 poprzednich warunków powstaje taki podział przestrzeni cech:
Rysunek 5. Rozdzielenie spacji cech w warunkach opisanych na Rysunku 4.
Warunki binarne i niebinarne
Warunki z 2 możliwymi wynikami (np. prawda lub fałsz) są nazywane warunkami binarnymi. Drzewa decyzyjne zawierające tylko warunki binarne są nazywane drzewami decyzyjnymi binarnymi.
Warunki niebinarne mają więcej niż 2 możliwe wyniki. Dlatego warunki niebinarne mają większą moc dyskryminacyjną niż warunki binarne. Decyzje zawierające co najmniej 1 warunek niebinarny są nazywane niebinarnymi drzewami decyzyjnymi.
Rysunek 6. Drzewa decyzyjne binarne i niebinarne.
W warunkach o zbyt dużej mocy może się też okazać, że będzie ona ponad pojemność. Z tego powodu w lasach decyzyjnych stosowane są zazwyczaj drzewa decyzyjne binarne, więc w tym kursie skupimy się właśnie na nich.
Najczęstszym typem warunku jest warunek progowy, który ma postać:
feature ≥ threshold
Na przykład:
num_legs ≥ 2
Istnieją też inne typy warunków. Oto inne często używane typy warunków binarnych:
Tabela 2. Typowe rodzaje warunków binarnych.
funkcji | Warunek | Przykład |
warunek progowy | $\mathrm{feature}_i \geq \mathrm{threshold}$ | $\mathrm{num\_legs} \geq 2$ |
warunek równości | $\mathrm{feature}_i = \mathrm{value}$ | $\mathrm{species} = ``kot"$ |
warunek w zestawie | $\mathrm{feature}_i \in \mathrm{collection}$ | $\mathrm{species} \in \{``kot", ``pies", ``ptak"\}$ |
warunek skośny | $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ | 5 USD \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$ |
brak funkcji | $\mathrm{feature}_i \mathrm{is} \mathrm{brak}$ | $\mathrm{num\_legs} \mathrm{is} \mathrm{brak}$ |