Karar ağaçları

Karar ormanı modelleri karar ağaçlarından oluşur. Karar ormanı öğrenme algoritmaları (ör. rastgele ormanlar), en azından kısmen karar ağaçlarının öğrenilmesine dayanır.

Kursun bu bölümünde, küçük bir örnek veri kümesini inceleyecek ve tek bir karar ağacının nasıl eğitildiğini öğreneceksiniz. Sonraki bölümlerde, karar ağaçlarının karar ormanlarını eğitmek için nasıl birleştirildiğini öğreneceksiniz.

YDF Kodu

YDF'de, ayrı karar ağacı modellerini eğitmek için CART öğrenicisini kullanın:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

Model

Karar ağacı, ağaç şeklinde hiyerarşik olarak düzenlenmiş bir "soru" koleksiyonundan oluşan bir modeldir. Sorular genellikle koşul, bölüm veya test olarak adlandırılır. Bu sınıfta "durum" terimini kullanacağız. Yaprak olmayan her düğüm bir koşul, yaprak düğümler ise bir tahmin içerir.

Botanik ağaçlar genellikle kökleri aşağıda olacak şekilde büyür. Ancak karar ağaçları genellikle en üstte kök (ilk düğüm) olacak şekilde gösterilir.

İki koşul ve üç yaprak içeren bir karar ağacı. İlk koşul (kök), num_legs >= 3; ikinci koşul ise num_eyes >= 3. Üç yaprak; penguen, örümcek ve köpek.

Şekil 1. Basit bir sınıflandırma karar ağacı. Yeşil renkli açıklama metni karar ağacının bir parçası değildir.

 

Karar ağacı modelinin çıkarımı, bir örneği kökten (üstte) koşullara göre alt düğümlerden birine (altta) yönlendirerek hesaplanır. Ulaşılan yaprağın değeri, karar ağacının tahminidir. Ziyaret edilen düğüm grubuna çıkarım yolu adı verilir. Örneğin, aşağıdaki özellik değerlerini ele alalım:

num_legs num_eyes
4 2

Tahmin köpek olur. Çıkarsama yolu şu şekilde olur:

  1. num_legs ≥ 3 → Evet
  2. num_eyes ≥ 3 → Hayır

Şekil 1 ile aynı görseldir ancak bu görselde, iki koşuldaki çıkarım yolunun köpek yaprağında sona erdiği gösterilmektedir.

Şekil 2. *{num_legs : 4, num_eyes : 2}* örneğinde *köpek* yaprağıyla sonuçlanan çıkarım yolu.

 

Önceki örnekte, karar ağacının yaprakları sınıflandırma tahminlerini içerir. Yani her yaprak, olası türlerden bir hayvan türünü içerir.

Benzer şekilde karar ağaçları, yaprakları regresif tahminlerle (sayısal değerler) etiketleyerek sayısal değerleri tahmin edebilir. Örneğin, aşağıdaki karar ağacı bir hayvanın 0 ile 10 arasında sayısal bir sevimlilik puanını tahmin eder.

Her yaprağın farklı bir kayan nokta sayısı içerdiği bir karar ağacı.

Şekil 3. Sayısal tahmin yapan bir karar ağacı.