ประเภทเงื่อนไข

หน่วยนี้มุ่งเน้นที่เงื่อนไขประเภทต่างๆ ที่ใช้ในการสร้างการตัดสินใจ ต้นไม้

เงื่อนไขตามแกนกับแนวเอียง

เงื่อนไขตามแกน เงื่อนไข จะเกี่ยวข้องกับฟีเจอร์เดียวเท่านั้น ไอคอนเอียง สภาพสินค้าเกี่ยวข้องกับหลายฟีเจอร์ ตัวอย่างเช่น ต่อไปนี้คือ เงื่อนไขตามแกน:

num_legs ≥ 2

แม้ว่าเงื่อนไขต่อไปนี้จะเป็นแบบเอียง:

num_legs ≥ num_fingers

ส่วนใหญ่แล้ว แผนผังการตัดสินใจจะได้รับการฝึกด้วยเงื่อนไขที่สอดคล้องกับแกนเท่านั้น อย่างไรก็ตาม การแยกแบบเฉียงจะมีประสิทธิภาพมากกว่าเพราะสามารถแสดงแบบซับซ้อนกว่า รูปแบบ บางครั้งการแยกแบบเอียงก็ให้ผลลัพธ์ที่ดีกว่า โดยมีค่าใช้จ่าย ของต้นทุนการอบรมและการอนุมานที่สูงขึ้น

รหัส YDF
ใน YDF แผนผังการตัดสินใจจะได้รับการฝึกด้วยเงื่อนไขที่สอดคล้องกับแกนโดยค่าเริ่มต้น คุณสามารถเปิดใช้ต้นไม้เอียงการตัดสินใจด้วย พารามิเตอร์ split_axis="SPARSE_OBLIQUE"

เงื่อนไขตามแกนคือ "num_legs >= 3" เงื่อนไขการเอียงคือ
  "จำนวนขา + น้ำหนัก * 5 >= 12"

รูปที่ 4 ตัวอย่างของเงื่อนไขที่จัดแนวแกนและเงื่อนไขแบบเอียง

 

การสร้างกราฟของเงื่อนไข 2 ข้อข้างต้นช่วยให้เห็นพื้นที่ของฟีเจอร์ต่อไปนี้ การแยก:

กราฟแสดงน้ำหนักเทียบกับ num_legs เงื่อนไขที่วางตามแกนไม่
  ไม่สนใจน้ำหนัก ดังนั้นจึงเป็นเพียงเส้นแนวตั้ง ภาพเอียง
  เงื่อนไขจะแสดงเส้นที่เอียงแบบลบ

รูปที่ 5 การแยกพื้นที่ฟีเจอร์สำหรับเงื่อนไขในรูปที่ 4

 

เงื่อนไขไบนารีกับนอนไบนารี

เงื่อนไขที่มีผลลัพธ์ที่เป็นไปได้ 2 อย่าง (เช่น จริงหรือเท็จ) จะเรียกว่า เงื่อนไขไบนารี แผนผังการตัดสินใจที่มีเฉพาะเงื่อนไขไบนารีคือ ที่เรียกว่าต้นไม้การตัดสินใจแบบไบนารี

ภาวะนอนไบนารีมีผลลัพธ์ที่เป็นไปได้มากกว่า 2 รายการ ดังนั้น เงื่อนไขนอนไบนารีมีกำลังในการเลือกปฏิบัติมากกว่าเงื่อนไขไบนารี การตัดสินใจที่มีเงื่อนไขที่ไม่ใช่ไบนารีอย่างน้อย 1 รายการเรียกว่า การตัดสินใจที่ไม่ใช่ทั้งไบนารี ต้นไม้

การเปรียบเทียบต้นไม้การตัดสินใจแบบไบนารีกับนอนไบนารี การตัดสินใจของไบนารี
  ต้นไม้มีเงื่อนไขไบนารี 2 เงื่อนไข แผนผังการตัดสินใจนอนไบนารี
  มีเงื่อนไขที่ไม่ใช่ไบนารีหนึ่งเงื่อนไข

รูปที่ 6: ต้นไม้การตัดสินใจแบบไบนารีเทียบกับนอนไบนารี

 

เงื่อนไขที่มีมากเกินไป และมีแนวโน้มที่จะมีไฟมากเกินไปด้วย ด้วยเหตุนี้ ป่าแห่งการตัดสินใจ โดยทั่วไปจะใช้แผนผังการตัดสินใจแบบเลขฐานสอง ดังนั้น หลักสูตรนี้จะเน้นที่องค์ประกอบเหล่านี้

ประเภทเงื่อนไขที่พบบ่อยที่สุดคือเงื่อนไขเกณฑ์ซึ่งแสดงดังนี้

featurethreshold

เช่น

num_legs ≥ 2

อาจมีเงื่อนไขประเภทอื่นๆ ต่อไปนี้คือประเภทของ เงื่อนไขไบนารี:

 

ตาราง 2. ประเภทของเงื่อนไขไบนารีที่พบบ่อย

ชื่อ เงื่อนไข ตัวอย่าง
เงื่อนไขของเกณฑ์ $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
เงื่อนไขความเท่าเทียม $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
เงื่อนไขในเซ็ต $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
เงื่อนไขเอียง $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
ไม่มีฟีเจอร์ $\mathrm{feature}_i \mathrm{is} \mathrm{Missing}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{Missing}$