Drzewa decyzyjne

Modele lasów decyzyjnych składają się z drzew decyzyjnych. Las decyzyjny algorytmy uczenia się (takie jak losowe lasy) opierają się, przynajmniej częściowo, na systemów uczących się na podstawie drzew decyzyjnych.

W tej części kursu poznasz niewielki przykładowy zbiór danych i dowiesz się, jak trenowane są modele oparte na pojedynczym drzewie decyzyjnym. W kolejnych sekcjach dowiesz się, jak drzewa decyzyjne są łączone, aby trenować lasy decyzyjne.

Kod YDF

W YDF użyj modułu uczenia się CART do wytrenowania poszczególnych modeli drzewa decyzyjnego:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

Model

Drzewo decyzji to model składający się z kolekcji „pytań” uporządkował hierarchicznie na kształt drzewa. Pytania te są zwykle nazywane warunek, podzielony lub test. Wykorzystamy termin „stan”, cale tych zajęć. Każdy węzeł inny niż liść zawiera warunek, a każdy węzeł liścia zawiera prognozę.

Drzewa botaniczne rosną zwykle z korzeniem u dołu. jednak decyzja drzewa są zwykle reprezentowane z korzeniem (pierwszym węzłem) na górze.

Drzewo decyzyjne zawierające 2 warunki i 3 liści. Pierwszy
warunek (pierwiastek) to num_legs >= 3; drugi warunek to
liczba_oczu >= 3. Trzy liście to pingwin, pająk,
i psa.

Rysunek 1. Proste drzewo decyzyjne dotyczące klasyfikacji. Legenda na zielono nie jest częścią systemu decyzyjnego. .

 

Wnioskowanie modelu drzewa decyzyjnego jest obliczane przez skierowanie przykładu z pierwiastek (na górze) do jednego z węzłów liści (u dołu) zgodnie z warunków. Wartość uzyskanego liścia to prognoza drzewa decyzyjnego. Zbiór odwiedzonych węzłów jest nazywany ścieżką wnioskowania. Przykład: uwzględnij następujące wartości cech:

num_legs num_eyes
4 2

Prognoza będzie wyglądać tak: pies. Ścieżka wnioskowania wyglądałaby tak:

  1. num_legs ≥ 3 → Tak
  2. num_eyes ≥ 3 → Nie

Ta sama ilustracja co na ilustracji 1, ale pokazuje
  ścieżki wnioskowania w 2 warunkach, która kończy się na liściu (w przypadku psa).

Rysunek 2. Ścieżka wnioskowania, której kulminacją jest liść *pies* w przykładzie *{num_legs : 4, num_eyes : 2}*. .

 

W poprzednim przykładzie liście drzewa decyzyjnego zawierają klasyfikację. prognozy; czyli każdy liść zawiera gatunek zwierzęcia z z możliwych gatunków.

Analogicznie drzewa decyzyjne mogą prognozować wartości liczbowe, oznaczając liście etykietami prognozy regresywne (wartości liczbowe). Na przykład ta decyzja: drzewo określa liczbowy wynik uroku zwierzęcia z zakresu od 0 do 10.

Drzewo decyzyjne, w którym każdy liść zawiera inną liczbę zmiennoprzecinkową
  numer.

Rysunek 3. Drzewo decyzyjne służące do tworzenia prognoz liczbowych. .