決策樹狀圖:隨堂測驗

本頁面會挑戰您回答一系列的複選練習,內容涵蓋「訓練決策樹」單元中討論的內容。

第 1 題

使用精確數值分隔器,將數值特徵替換為負值 (例如將值 +8 變更為 -8) 會產生什麼效果?
系統會學習相同的條件,只會切換正面/負面子項。
決策樹的結構會完全不同。
系統會學習不同的條件,但決策樹的整體結構會維持不變。

第 2 題

哪兩個答案最能說明只測試 X 中候選閾值值的一半 (隨機選取) 的效果?
最終決策樹的訓練準確度不會因此提升。
資訊增益會降低或維持不變。
最終決策樹的測試準確度會降低。
資訊增益會更高或相同。

第 3 題

如果「資訊增益」與「閾值」曲線有許多局部極大值,會發生什麼情況?
演算法會選取全域最大值。
不可能有多個局部極大值。
演算法會選取閾值值最小的局部極大值。

第 4 題

計算下列分割作業的資訊增益:

節點 正面示例數量 排除範例數量
父節點 10 6
第一個子項 8 2
第二個子項 2 4
# Positive label distribution
p_parent = 10 / (10+6) # = 0.625
p_child_1 = 8 / (8+2) # = 0.8
p_child_2 = 2 / (2+4) # = 0.3333333

# Entropy
h_parent = -p_parent * log(p_parent) - (1-p_parent) * log(1-p_parent) # = 0.6615632
h_child_1 = ... # = 0.5004024
h_child_2 = ... # = 0.6365142

# Ratio of example in the child 1
s = (8+2)/(10+6)
f_final = s * h_child_1 + (1-s) * h_child_2 # = 0.5514443

information_gain = h_parent - f_final # = 0.1101189