Modele lasów decyzyjnych składają się z drzew decyzyjnych. Las decyzyjny algorytmy uczenia się (takie jak losowe lasy) opierają się, przynajmniej częściowo, na systemów uczących się na podstawie drzew decyzyjnych.
W tej części kursu poznasz niewielki przykładowy zbiór danych i dowiesz się, jak trenowane są modele oparte na pojedynczym drzewie decyzyjnym. W kolejnych sekcjach dowiesz się, jak drzewa decyzyjne są łączone, aby trenować lasy decyzyjne.
W YDF użyj modułu uczenia się CART do wytrenowania poszczególnych modeli drzewa decyzyjnego:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
Model
Drzewo decyzji to model składający się z kolekcji „pytań” uporządkował hierarchicznie na kształt drzewa. Pytania te są zwykle nazywane warunek, podzielony lub test. Wykorzystamy termin „stan”, cale tych zajęć. Każdy węzeł inny niż liść zawiera warunek, a każdy węzeł liścia zawiera prognozę.
Drzewa botaniczne rosną zwykle z korzeniem u dołu. jednak decyzja drzewa są zwykle reprezentowane z korzeniem (pierwszym węzłem) na górze.
Rysunek 1. Proste drzewo decyzyjne dotyczące klasyfikacji. Legenda na zielono nie jest częścią systemu decyzyjnego. .
Wnioskowanie modelu drzewa decyzyjnego jest obliczane przez skierowanie przykładu z pierwiastek (na górze) do jednego z węzłów liści (u dołu) zgodnie z warunków. Wartość uzyskanego liścia to prognoza drzewa decyzyjnego. Zbiór odwiedzonych węzłów jest nazywany ścieżką wnioskowania. Przykład: uwzględnij następujące wartości cech:
num_legs | num_eyes |
---|---|
4 | 2 |
Prognoza będzie wyglądać tak: pies. Ścieżka wnioskowania wyglądałaby tak:
- num_legs ≥ 3 → Tak
- num_eyes ≥ 3 → Nie
Rysunek 2. Ścieżka wnioskowania, której kulminacją jest liść *pies* w przykładzie *{num_legs : 4, num_eyes : 2}*. .
W poprzednim przykładzie liście drzewa decyzyjnego zawierają klasyfikację. prognozy; czyli każdy liść zawiera gatunek zwierzęcia z z możliwych gatunków.
Analogicznie drzewa decyzyjne mogą prognozować wartości liczbowe, oznaczając liście etykietami prognozy regresywne (wartości liczbowe). Na przykład ta decyzja: drzewo określa liczbowy wynik uroku zwierzęcia z zakresu od 0 do 10.
Rysunek 3. Drzewo decyzyjne służące do tworzenia prognoz liczbowych. .