หน้านี้ได้รับการแปลโดย Cloud Translation API

สรุปหลักสูตร

ข้อมูลสรุปสั้นๆ ของสิ่งที่คุณได้เรียนรู้ในหลักสูตรมีดังนี้

แผนผังการตัดสินใจเป็นโมเดลหนึ่ง ประกอบด้วยคอลเล็กชันของ จัดระเบียบเงื่อนไขแล้ว ตามลำดับชั้นในรูปร่างของต้นไม้ สภาพซึ่งแตกต่างกันไป หมวดหมู่:
- ตามแนวแกน condition ประกอบด้วย ฟีเจอร์เดียวเท่านั้น เอียง condition ประกอบด้วย หลายฟีเจอร์
- ไบนารี condition มี 2 รูปแบบที่เป็นไปได้ ผลลัพธ์ นอนไบนารี condition มีมากกว่า 2 ผลลัพธ์ที่เป็นไปได้
การฝึกแผนผังการตัดสินใจเกี่ยวข้องกับการค้นหาสภาวะที่ดีที่สุด แต่ละโหนด กิจวัตร Splitter ใช้เมตริกเช่นข้อมูล ได้รับหรือ Gini เพื่อกำหนดรูปแบบที่ดีที่สุด
ส่วนการตัดสินใจคือ โหมดที่มีแผนผังการตัดสินใจหลายต้น การคาดคะเนของส่วนการตัดสินใจ คือการรวมการคาดคะเนของแผนผังการตัดสินใจ
ป่าแบบสุ่มเป็น ชุดของแผนผังการตัดสินใจ ซึ่งแต่ละแผนผังการตัดสินใจได้รับการฝึกด้วย นอยส์เฉพาะที่สุ่มขึ้นได้
การแบกกระเป๋าเป็นเทคนิคที่ แผนผังการตัดสินใจแต่ละอันในป่าสุ่มจะได้รับการฝึกในชุดย่อยที่ต่างกัน ตัวอย่างมากมาย
ฟอเรสต์แบบสุ่มไม่จำเป็นต้องมีชุดข้อมูลการตรวจสอบ แต่ส่วนใหญ่จะสุ่มเลือก ใช้เทคนิคที่เรียกว่า out-of-bag-evaluation เพื่อประเมินคุณภาพของโมเดล
การไล่ระดับสี (การตัดสินใจ) แผนผัง เป็นประเภทของป่าการตัดสินใจที่ผ่านการฝึกสอนผ่านการปรับเปลี่ยนซ้ำๆ จากข้อมูล ต้นไม้การตัดสินใจ ค่าที่เรียกว่า shrinkage ควบคุมอัตรา ซึ่งต้นไม้ที่เพิ่มระดับ (ตัดสิน) การไล่ระดับสีจะเรียนรู้และระดับการไล่ระดับสี มากเกินไป

ข้อมูลอ้างอิง

การประมาณค่าฟังก์ชัน Greedy: การเพิ่มการไล่ระดับสี เครื่อง ต. ฟรีดแมน
องค์ประกอบของสถิติ การเรียนรู้ Trevor Hastie บทที่ 10
โมเดลที่เพิ่มโดยทั่วไป: คู่มือสำหรับ gbm แพ็กเกจ ช. Ridgeway

การปรับให้เหมาะสมและการปรับให้เป็นมาตรฐาน