บทนำ

ป่าการตัดสินใจมีประโยชน์ดังนี้

  • กําหนดค่าได้ง่ายกว่าเครือข่ายประสาทเทียม ป่าการตัดสินใจมีไฮเปอร์พารามิเตอร์น้อยกว่า นอกจากนี้ ไฮเปอร์พารามิเตอร์ในป่าการตัดสินใจยังมีค่าเริ่มต้นที่ดี
  • โดยจัดการฟีเจอร์ที่เป็นตัวเลข หมวดหมู่ และฟีเจอร์ที่ขาดหายไปได้ ซึ่งหมายความว่าคุณจะเขียนโค้ดการประมวลผลข้อมูลก่อนการประมวลผลได้น้อยกว่ามากเมื่อเทียบกับการใช้เครือข่ายประสาทเทียม ซึ่งจะช่วยประหยัดเวลาและลดแหล่งที่มาของข้อผิดพลาด
  • มักให้ผลลัพธ์ที่ดีโดยอัตโนมัติ ทนทานต่อข้อมูลที่ไม่น่าเชื่อถือ และมีลักษณะที่ตีความได้
  • โดยสามารถอนุมานและฝึกจากชุดข้อมูลขนาดเล็ก (< 1 ล้านตัวอย่าง) ได้เร็วกว่ามากเมื่อเทียบกับโครงข่ายประสาท

ป่าการตัดสินใจให้ผลลัพธ์ที่ยอดเยี่ยมในการแข่งขันแมชชีนเลิร์นนิง และมีการนําไปใช้อย่างแพร่หลายในงานอุตสาหกรรมหลายอย่าง

หลักสูตรนี้จะแนะนำแผนผังการตัดสินใจและป่าการตัดสินใจ ป่าการตัดสินใจคือกลุ่มอัลกอริทึมแมชชีนเลิร์นนิงที่ตีความได้ซึ่งทำงานได้ดีกับข้อมูลตาราง ป่าการตัดสินใจทําสิ่งต่อไปนี้ได้

รหัส YDF
หลักสูตรนี้จะอธิบายวิธีการทำงานของ Decision Forest โดยไม่เน้นไปที่ไลบรารีใดๆ โดยเฉพาะ อย่างไรก็ตาม ตลอดหลักสูตร กล่องข้อความจะแสดงตัวอย่างโค้ดที่ใช้ไลบรารีป่าการตัดสินใจ YDF แต่สามารถแปลงเป็นไลบรารีป่าการตัดสินใจอื่นๆ ได้

ข้อกำหนดเบื้องต้น

หลักสูตรนี้ถือว่าคุณได้เรียนหลักสูตรต่อไปนี้จนจบหรือมีความรู้เทียบเท่า

ขอให้สนุกกับการเรียนรู้