Karar ağaçları

Karar ormanı modelleri karar ağaçlarından oluşur. Karar ormanı rastgele ormanlar gibi) öğrenme algoritmalarının öğrenmeye devam edeceğiz.

Kursun bu bölümünde küçük bir örnek veri kümesi inceleyecek ve nasıl eğitildiğini öğreneceğiz. Sonraki bölümlerde, proje kapsamının karar ağaçları, karar ormanlarını eğitmek için birleştirilir.

YDF Kodu

YDF'de bireysel karar ağacı modellerini eğitmek için CART öğrencisini kullanın:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

Model

Karar ağacı, bir "sorular" koleksiyonundan oluşan bir modeldir düzenlendi şeklinde bir hiyerarşiye sokan bir araçtır. Bu sorulara genellikle condition, bir bölme veya test. Burada ise "durum" terimini kullanacağız. inç bu sınıfa katılacağım. Yaprak olmayan her düğüm bir koşul içerir ve her yaprak düğüm bir tahmindir.

Botanik ağaçların kökleri genellikle dipte yetişir. ancak yine de ağaçlar genellikle üstte kök (ilk düğüm) ile temsil edilir.

İki koşul ve üç yaprak içeren bir karar ağacı. İlk
condition (kök) num_legs >= 3'tür; ikinci koşul
göz_sayısı >= 3. Üç yaprak penguen, örümcek ve
bir şeyler.

Şekil 1. Basit bir sınıflandırma karar ağacı. Yeşil renkteki gösterge bu açıklamanın görevi görür. ziyaret edin.

 

Bir karar ağacı modelinden çıkarım, göre yaprak düğümlerinden birine (üstte) kök koşullar. Erişilen yaprağın değeri karar ağacının tahminidir. Ziyaret edilen düğümler kümesine çıkarım yolu adı verilir. Örneğin, şu özellik değerlerini göz önünde bulundurun:

num_legs num_eyes
4 2

Köpek olacağını tahmin ediyoruz. Çıkarım yolu şöyle olur:

  1. num_legs ≥ 3 → Evet
  2. göz_sayısı ≥ 3 → Hayır

Şekil 1'dekiyle aynı çizim, ancak bu çizimde
  bir köpeğin yaprakta sonlanan çıkarım yolunu sunar.

Şekil 2. Örnekteki yaprak *köpek* ile sonlanan çıkarım yolu *{num_legs : 4, num_eyes : 2}*. ziyaret edin.

 

Önceki örnekte, karar ağacının yaprakları sınıflandırma içerir, tahminler; Yani her yaprakta, kümedeki bir hayvan türü bir tür deneme olarak düşünebilirsiniz.

Benzer şekilde, karar ağaçları yaprakları regresif tahminler (sayısal değerler). Örneğin, aşağıdaki karar ağaç, bir hayvanın sevimlilik puanının 0 ile 10 arasında olan sayısal bir sevimlilik puanını tahmin ediyor.

Her yaprağın farklı bir kayan nokta içerdiği karar ağacı
  sayı.

Şekil 3. Sayısal tahminde bulunan bir karar ağacı. ziyaret edin.