Koşul türleri

Bu birimde, karar ağaçları oluşturmak için kullanılan farklı koşul türleri ele alınmaktadır.

Eksenle hizalanmış ve eğik koşullar

Ekseni hizalanmış koşul yalnızca tek bir özellik içerir. Eğik koşul birden fazla özellik içerir. Örneğin, aşağıdaki koşul eksene göre hizalanmış bir koşuldur:

num_legs ≥ 2

Aşağıdaki ise eğik koşuldur:

num_legs ≥ num_fingers

Karar ağaçları genellikle yalnızca eksenle uyumlu koşullarla eğitilir. Ancak eğik bölme, daha karmaşık kalıpları ifade edebildiği için daha güçlüdür. Eğik bölme, bazen daha yüksek eğitim ve çıkarım maliyetleri pahasına daha iyi sonuçlar verir.

YDF Kodu
YDF'de karar ağaçları varsayılan olarak eksenle hizalanmış koşulla eğitilir. Karar eğik ağaçları split_axis="SPARSE_OBLIQUE" parametresini kullanarak etkinleştirebilirsiniz.

Eksenle hizalanmış koşul "num_legs >= 3" şeklindedir. Eğik koşul:
  "num_legs + weight * 5 >= 12".

Şekil 4. Eksenle hizalanmış koşul ve eğik koşul örnekleri.

 

Önceki iki koşulun grafiği, aşağıdaki özellik alanı ayırımını verir:

weight ve num_legs değerlerinin grafiği. Eksenle hizalanmış koşul, ağırlığı dikkate almaz ve bu nedenle yalnızca dikey bir çizgidir. Eğik koşul, negatif eğimli bir çizgi gösterir.

Şekil 5. Şekil 4'teki koşullar için özellik alanı ayırma.

 

İkili ve ikili olmayan koşullar

İki olası sonucu olan koşullara (örneğin, doğru veya yanlış) ikili koşullar denir. Yalnızca ikili koşullar içeren karar ağaçlarına ikili karar ağaçları denir.

İki değerli olmayan koşullar ikiden fazla olası sonuca sahiptir. Bu nedenle, ikili olmayan koşullar ikili koşullardan daha ayırt edicidir. Bir veya daha fazla ikilik olmayan koşul içeren kararlara ikilik olmayan karar ağaçları denir.

İkili ve ikili olmayan karar ağaçları karşılaştırması. İkili karar ağacı iki ikili koşul içerir; ikili olmayan karar ağacı ise bir ikili olmayan koşul içerir.

Şekil 6: İkili ve ikili olmayan karar ağaçları.

 

Çok fazla güce sahip koşulların aşırı uyum sağlama olasılığı da daha yüksektir. Bu nedenle karar ormanları genellikle ikili karar ağaçlarını kullanır. Bu nedenle bu kursta ikili karar ağaçlarına odaklanacağız.

En yaygın koşul türü, şu şekilde ifade edilen eşik koşuludur:

featurethreshold

Örneğin:

num_legs ≥ 2

Diğer koşul türleri de vardır. Yaygın olarak kullanılan diğer ikili koşul türleri şunlardır:

 

Tablo 2. Yaygın ikili koşul türleri.

Ad Durum Örnek
eşik koşulu $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
eşitlik koşulu $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
aralıktaki koşul $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
eğik koşul $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
özelliği eksik $\mathrm{feature}_i \mathrm{is} \mathrm{Missing}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$