ข้อมูลสรุปสั้นๆ ของสิ่งที่คุณได้เรียนรู้ในหลักสูตรมีดังนี้
- แผนผังการตัดสินใจเป็นโมเดลหนึ่ง
ประกอบด้วยคอลเล็กชันของ
จัดระเบียบเงื่อนไขแล้ว
ตามลำดับชั้นในรูปร่างของต้นไม้ สภาพซึ่งแตกต่างกันไป
หมวดหมู่:
- ตามแนวแกน condition ประกอบด้วย ฟีเจอร์เดียวเท่านั้น เอียง condition ประกอบด้วย หลายฟีเจอร์
- ไบนารี condition มี 2 รูปแบบที่เป็นไปได้ ผลลัพธ์ นอนไบนารี condition มีมากกว่า 2 ผลลัพธ์ที่เป็นไปได้
- การฝึกแผนผังการตัดสินใจเกี่ยวข้องกับการค้นหาสภาวะที่ดีที่สุด แต่ละโหนด กิจวัตร Splitter ใช้เมตริกเช่นข้อมูล ได้รับหรือ Gini เพื่อกำหนดรูปแบบที่ดีที่สุด
- ส่วนการตัดสินใจคือ โหมดที่มีแผนผังการตัดสินใจหลายต้น การคาดคะเนของส่วนการตัดสินใจ คือการรวมการคาดคะเนของแผนผังการตัดสินใจ
- ป่าแบบสุ่มเป็น ชุดของแผนผังการตัดสินใจ ซึ่งแต่ละแผนผังการตัดสินใจได้รับการฝึกด้วย นอยส์เฉพาะที่สุ่มขึ้นได้
- การแบกกระเป๋าเป็นเทคนิคที่ แผนผังการตัดสินใจแต่ละอันในป่าสุ่มจะได้รับการฝึกในชุดย่อยที่ต่างกัน ตัวอย่างมากมาย
- ฟอเรสต์แบบสุ่มไม่จำเป็นต้องมีชุดข้อมูลการตรวจสอบ แต่ส่วนใหญ่จะสุ่มเลือก ใช้เทคนิคที่เรียกว่า out-of-bag-evaluation เพื่อประเมินคุณภาพของโมเดล
- การไล่ระดับสี (การตัดสินใจ) แผนผัง เป็นประเภทของป่าการตัดสินใจที่ผ่านการฝึกสอนผ่านการปรับเปลี่ยนซ้ำๆ จากข้อมูล ต้นไม้การตัดสินใจ ค่าที่เรียกว่า shrinkage ควบคุมอัตรา ซึ่งต้นไม้ที่เพิ่มระดับ (ตัดสิน) การไล่ระดับสีจะเรียนรู้และระดับการไล่ระดับสี มากเกินไป
ข้อมูลอ้างอิง
- การประมาณค่าฟังก์ชัน Greedy: การเพิ่มการไล่ระดับสี เครื่อง ต. ฟรีดแมน
- องค์ประกอบของสถิติ การเรียนรู้ Trevor Hastie บทที่ 10
- โมเดลที่เพิ่มโดยทั่วไป: คู่มือสำหรับ gbm แพ็กเกจ ช. Ridgeway