แผนผังการตัดสินใจ: ตรวจสอบความเข้าใจ

หน้านี้จะให้คุณตอบชุดแบบฝึกหัดแบบหลายตัวเลือกเกี่ยวกับเนื้อหาที่กล่าวถึงในหน่วย "การฝึก Decision Tree"

คำถามที่ 1

การแทนที่ฟีเจอร์ตัวเลขด้วยค่าลบ (เช่น เปลี่ยนค่า +8 เป็น -8) ด้วยตัวแบ่งตัวเลขที่แน่นอนจะส่งผลต่อผลลัพธ์อย่างไร
ระบบจะเรียนรู้เงื่อนไขต่างๆ แต่โครงสร้างโดยรวมของแผนภูมิการตัดสินใจจะยังคงเหมือนเดิม
โครงสร้างของแผนผังการตัดสินใจจะแตกต่างออกไปโดยสิ้นเชิง
ระบบจะเรียนรู้เงื่อนไขเดียวกัน แต่จะสลับเฉพาะเงื่อนไขย่อยเชิงบวก/เชิงลบเท่านั้น

คำถามที่ 2

คำตอบ 2 ข้อใดอธิบายผลของการทดสอบค่าเกณฑ์ผู้สมัครใน X เพียงครึ่งเดียว (สุ่มเลือก) ได้ดีที่สุด
แผนผังการตัดสินใจสุดท้ายจะมีความแม่นยำในการทดสอบแย่ลง
ข้อมูลที่ได้รับจะต่ำกว่าหรือเท่ากับ
แผนผังการตัดสินใจสุดท้ายจะไม่มีความแม่นยำในการฝึกอบรมที่ดีกว่าเดิม
ข้อมูลที่ได้รับจะสูงกว่าหรือเท่ากับ

คำถามที่ 3

จะเกิดอะไรขึ้นหากเส้นโค้ง "การได้ข้อมูล" เทียบกับ "เกณฑ์" มีจุดสูงสุดในพื้นที่หลายจุด
อัลกอริทึมจะเลือกค่าสูงสุดทั่วโลก
เป็นไปไม่ได้ที่จะมีจุดสูงสุดในพื้นที่หลายจุด
อัลกอริทึมจะเลือกจุดสูงสุดในพื้นที่ที่มีค่าเกณฑ์ต่ำที่สุด

คำถามที่ 4

คํานวณการได้ข้อมูลจากการแยกกลุ่มต่อไปนี้

โหนด จํานวนตัวอย่างเชิงบวก จํานวนตัวอย่างเชิงลบ
โหนดหลัก 10 6
บุตรคนแรก 8 2
บุตรคนที่ 2 2 4
# Positive label distribution
p_parent = 10 / (10+6) # = 0.625
p_child_1 = 8 / (8+2) # = 0.8
p_child_2 = 2 / (2+4) # = 0.3333333

# Entropy
h_parent = -p_parent * log(p_parent) - (1-p_parent) * log(1-p_parent) # = 0.6615632
h_child_1 = ... # = 0.5004024
h_child_2 = ... # = 0.6365142

# Ratio of example in the child 1
s = (8+2)/(10+6)
f_final = s * h_child_1 + (1-s) * h_child_2 # = 0.5514443

information_gain = h_parent - f_final # = 0.1101189