Karar ağaçları: Öğrendiklerinizi kontrol edin

Bu sayfada, "Karar Ağaçları Eğitimi" biriminde ele alınan materyallerle ilgili bir dizi çoktan seçmeli alıştırmayı yanıtlamanız istenir.

1. Soru

Tam sayı bölme işleviyle sayısal özelliklerin negatif değerleriyle (ör. +8 değerinin -8 olarak değiştirilmesi) değiştirilmesinin sonuçları nelerdir?
Karar ağacının yapısı tamamen farklı olacaktır.
Aynı koşullar öğrenilir; yalnızca olumlu/olumsuz çocuklar değiştirilir.
Farklı koşullar öğrenilir ancak karar ağacının genel yapısı aynı kalır.

2. Soru

X'deki aday eşik değerlerinin yalnızca yarısını (rastgele seçilmiş) test etmenin etkisini en iyi açıklayan iki yanıt nedir?
Son karar ağacının test doğruluğu daha düşük olur.
Bilgi kazancı daha düşük veya eşit olur.
Bilgi kazancı daha yüksek veya eşit olur.
Nihai karar ağacının eğitim doğruluğu daha iyi olmaz.

3. Soru

"Bilgi kazancı" ve "eşik" eğrisi birden fazla yerel maksimuma sahipse ne olur?
Algoritma, en küçük eşik değerine sahip yerel maksimumları seçer.
Birden fazla yerel maksimum değeri olamaz.
Algoritma, genel maksimum değeri seçer.

4. Soru

Aşağıdaki bölme işleminin bilgi kazancını hesaplayın:

Düğüm pozitif örnek sayısı Olumsuz örnek sayısı
üst düğüm 10 6
ilk çocuk 8 2
ikinci çocuk 2 4
# Positive label distribution
p_parent = 10 / (10+6) # = 0.625
p_child_1 = 8 / (8+2) # = 0.8
p_child_2 = 2 / (2+4) # = 0.3333333

# Entropy
h_parent = -p_parent * log(p_parent) - (1-p_parent) * log(1-p_parent) # = 0.6615632
h_child_1 = ... # = 0.5004024
h_child_2 = ... # = 0.6365142

# Ratio of example in the child 1
s = (8+2)/(10+6)
f_final = s * h_child_1 + (1-s) * h_child_2 # = 0.5514443

information_gain = h_parent - f_final # = 0.1101189