Karar ormanı modelleri karar ağaçlarından oluşur. Karar ormanı rastgele ormanlar gibi) öğrenme algoritmalarının öğrenmeye devam edeceğiz.
Kursun bu bölümünde küçük bir örnek veri kümesi inceleyecek ve nasıl eğitildiğini öğreneceğiz. Sonraki bölümlerde, proje kapsamının karar ağaçları, karar ormanlarını eğitmek için birleştirilir.
YDF'de bireysel karar ağacı modellerini eğitmek için CART öğrencisini kullanın:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
Model
Karar ağacı, bir "sorular" koleksiyonundan oluşan bir modeldir düzenlendi şeklinde bir hiyerarşiye sokan bir araçtır. Bu sorulara genellikle condition, bir bölme veya test. Burada ise "durum" terimini kullanacağız. inç bu sınıfa katılacağım. Yaprak olmayan her düğüm bir koşul içerir ve her yaprak düğüm bir tahmindir.
Botanik ağaçların kökleri genellikle dipte yetişir. ancak yine de ağaçlar genellikle üstte kök (ilk düğüm) ile temsil edilir.
Şekil 1. Basit bir sınıflandırma karar ağacı. Yeşil renkteki gösterge bu açıklamanın görevi görür. ziyaret edin.
Bir karar ağacı modelinden çıkarım, göre yaprak düğümlerinden birine (üstte) kök koşullar. Erişilen yaprağın değeri karar ağacının tahminidir. Ziyaret edilen düğümler kümesine çıkarım yolu adı verilir. Örneğin, şu özellik değerlerini göz önünde bulundurun:
num_legs | num_eyes |
---|---|
4 | 2 |
Köpek olacağını tahmin ediyoruz. Çıkarım yolu şöyle olur:
- num_legs ≥ 3 → Evet
- göz_sayısı ≥ 3 → Hayır
Şekil 2. Örnekteki yaprak *köpek* ile sonlanan çıkarım yolu *{num_legs : 4, num_eyes : 2}*. ziyaret edin.
Önceki örnekte, karar ağacının yaprakları sınıflandırma içerir, tahminler; Yani her yaprakta, kümedeki bir hayvan türü bir tür deneme olarak düşünebilirsiniz.
Benzer şekilde, karar ağaçları yaprakları regresif tahminler (sayısal değerler). Örneğin, aşağıdaki karar ağaç, bir hayvanın sevimlilik puanının 0 ile 10 arasında olan sayısal bir sevimlilik puanını tahmin ediyor.
Şekil 3. Sayısal tahminde bulunan bir karar ağacı. ziyaret edin.