ความสำคัญที่เปลี่ยนแปลงได้

ลำดับความสำคัญของตัวแปร (หรือที่เรียกว่าลำดับความสำคัญของฟีเจอร์) คือคะแนนที่ระบุว่าฟีเจอร์ "มีความสำคัญ" ต่อโมเดลมากน้อยเพียงใด เช่น หากโมเดลที่มีฟีเจอร์อินพุต 2 รายการ "f1" และ "f2" ตัวแปรมีความสำคัญคือ {f1=5.8, f2=2.5} ฟีเจอร์ "f1" จะมี "สำคัญ" ต่อโมเดลมากกว่าฟีเจอร์ "f2" ลำดับความสำคัญของตัวแปรเป็นวิธีง่ายๆ ในการทำความเข้าใจวิธีการทำงานของแผนผังการตัดสินใจ เช่นเดียวกับโมเดลแมชชีนเลิร์นนิงอื่นๆ

คุณสามารถใช้ลำดับความสำคัญของตัวแปรที่เทียบได้กับโมเดล เช่น ความสำคัญของตัวแปรการเรียงสับเปลี่ยนกับแผนผังการตัดสินใจ

ต้นไม้การตัดสินใจยังมีความสำคัญตัวแปรที่เฉพาะเจาะจง เช่น

  • ผลรวมของคะแนนแยกที่มีตัวแปรที่กำหนด
  • จำนวนโหนดที่มีตัวแปรที่กำหนด
  • ความลึกเฉลี่ยของจุดสนใจครั้งแรกในเส้นทางต้นไม้ทั้งหมด

ซึ่งความสําคัญที่แปรผันอาจแตกต่างกันไปตามคุณภาพต่างๆ เช่น

  • ความหมาย
  • มาตราส่วน
  • พร็อพเพอร์ตี้

นอกจากนี้ ความสําคัญของตัวแปรยังให้ข้อมูลประเภทต่างๆ เกี่ยวกับสิ่งต่อไปนี้

  • โมเดล
  • ชุดข้อมูล
  • กระบวนการฝึกอบรม

เช่น จำนวนเงื่อนไขที่มีฟีเจอร์หนึ่งๆ จะบ่งบอกว่าแผนผังการตัดสินใจดูฟีเจอร์เฉพาะนี้มากน้อยเพียงใด ซึ่งอาจระบุถึงความสำคัญของตัวแปร เพราะอย่างไรก็ดี อัลกอริทึมการเรียนรู้คงไม่ได้ใช้ฟีเจอร์ ในหลายๆ เงื่อนไข หากไม่มีความสำคัญ อย่างไรก็ตาม ฟีเจอร์เดียวกันที่ปรากฏในหลายเงื่อนไขอาจบ่งชี้ว่าโมเดลกำลังพยายามอยู่แต่ไม่ได้ทำให้รูปแบบของฟีเจอร์เป็นกลาง เช่น กรณีนี้อาจเกิดขึ้นเมื่อฟีเจอร์เป็นเพียงตัวอย่างตัวระบุที่ไม่มีข้อมูลสำหรับสร้างภาพรวม

ในทางตรงกันข้าม ค่าสูงสำหรับความสำคัญของตัวแปรการเรียงสับเปลี่ยนสูงจะบ่งบอกว่าการนำฟีเจอร์ออกจะทำร้ายโมเดล ซึ่งเป็นตัวบ่งชี้ถึงความสำคัญของตัวแปร แต่หากโมเดลนั้นแข็งแกร่ง การนำฟีเจอร์ใดฟีเจอร์หนึ่งออกอาจไม่ส่งผลเสียกับโมเดล

เนื่องจากลำดับความสำคัญของตัวแปรต่างๆ บอกถึงแง่มุมที่แตกต่างกันของโมเดล การดูที่ความสำคัญตัวแปรหลายๆ อย่างพร้อมกันจึงมีประโยชน์ ตัวอย่างเช่น หากฟีเจอร์หนึ่งมีความสำคัญตามตัวแปรความสำคัญทั้งหมด ก็เป็นไปได้ว่าฟีเจอร์นี้จะมีความสำคัญ อีกตัวอย่างหนึ่งคือ หากฟีเจอร์มีความสำคัญตัวแปร "จำนวนโหนด" สูงและความสำคัญตัวแปร "การเรียงสับเปลี่ยน" เพียงเล็กน้อย ฟีเจอร์นี้อาจสร้างภาพรวมได้ยากและอาจทำให้คุณภาพของโมเดลแย่ลงได้

รหัส YDF
ใน YDF คุณดูลำดับความสำคัญตัวแปรของโมเดลได้โดยการเรียกใช้ model.describe() และดูที่แท็บ "ลำดับความสำคัญตัวแปร" ดูรายละเอียดเพิ่มเติมใน บทแนะนำการทำความเข้าใจโมเดล