ความสำคัญของตัวแปร

ความสำคัญของตัวแปร (หรือที่เรียกว่าความสำคัญของฟีเจอร์) คือคะแนนที่บ่งบอกถึงความ "สำคัญ" ของฟีเจอร์ต่อโมเดล ตัวอย่างเช่น หากโมเดลหนึ่งๆ มีฟีเจอร์อินพุต 2 รายการ ได้แก่ "f1" และ "f2" และความสําคัญของตัวแปรคือ {f1=5.8, f2=2.5} แสดงว่าฟีเจอร์ "f1" "สําคัญ" ต่อโมเดลมากกว่าฟีเจอร์ "f2" ความสำคัญของตัวแปรเป็นวิธีง่ายๆ ในการทำความเข้าใจวิธีการทํางานของแผนภูมิการตัดสินใจเช่นเดียวกับโมเดลแมชชีนเลิร์นนิงอื่นๆ

คุณสามารถใช้ความสำคัญของตัวแปรที่ไม่ขึ้นอยู่กับโมเดล เช่น ความสำคัญของตัวแปรการสับเปลี่ยน กับต้นไม้การตัดสินใจได้

แผนภูมิการตัดสินใจยังมีความสำคัญของตัวแปรที่เฉพาะเจาะจง เช่น

  • ผลรวมของคะแนนการแยกที่มีตัวแปรหนึ่งๆ
  • จํานวนโหนดที่มีตัวแปรหนึ่งๆ
  • ความลึกเฉลี่ยของการเกิดครั้งแรกขององค์ประกอบในเส้นทางต้นไม้ทั้งหมด

ความสำคัญของตัวแปรอาจแตกต่างกันไปตามคุณภาพ เช่น

  • ความหมาย
  • ปรับขนาด
  • พร็อพเพอร์ตี้

นอกจากนี้ ความสําคัญของตัวแปรจะให้ข้อมูลประเภทต่างๆ เกี่ยวกับสิ่งต่อไปนี้

  • โมเดล
  • ชุดข้อมูล
  • กระบวนการฝึกอบรม

เช่น จํานวนเงื่อนไขที่มีฟีเจอร์หนึ่งๆ บ่งบอกถึงระดับที่ต้นไม้การตัดสินใจพิจารณาฟีเจอร์หนึ่งๆ ซึ่งอาจบ่งบอกถึงความสําคัญของตัวแปร ท้ายที่สุดแล้ว อัลกอริทึมการเรียนรู้คงไม่ได้ใช้ฟีเจอร์ในหลายเงื่อนไขหากฟีเจอร์นั้นไม่สำคัญ อย่างไรก็ตาม ฟีเจอร์เดียวกันที่ปรากฏในหลายเงื่อนไขอาจบ่งชี้ว่าโมเดลพยายามสรุปรูปแบบของฟีเจอร์แต่ไม่สําเร็จ ตัวอย่างเช่น กรณีนี้อาจเกิดขึ้นเมื่อฟีเจอร์เป็นเพียงตัวระบุตัวอย่างที่ไม่มีข้อมูลทั่วไป

ในทางกลับกัน ค่าสูงสําหรับความสําคัญของตัวแปรการสับเปลี่ยนสูงบ่งชี้ว่าการนําฟีเจอร์ออกส่งผลเสียต่อโมเดล ซึ่งเป็นตัวบ่งชี้ความสําคัญของตัวแปร อย่างไรก็ตาม หากโมเดลมีประสิทธิภาพดี การนําฟีเจอร์ใดฟีเจอร์หนึ่งออกอาจไม่ส่งผลเสียต่อโมเดล

เนื่องจากความสำคัญของตัวแปรแต่ละรายการให้ข้อมูลเกี่ยวกับแง่มุมต่างๆ ของโมเดล การดูความสำคัญของตัวแปรหลายรายการพร้อมกันจึงให้ข้อมูล เช่น หากฟีเจอร์หนึ่งมีความสําคัญตามความสําคัญของตัวแปรทั้งหมด ฟีเจอร์นี้ก็มีความสําคัญ อีกตัวอย่างหนึ่งคือ หากฟีเจอร์มี "จํานวนโหนด" ของตัวแปรที่มีความสําคัญสูงและ "การเปลี่ยนลําดับ" ของตัวแปรที่มีความสําคัญต่ำ ฟีเจอร์นี้อาจทําให้สรุปได้ยากและอาจทําให้คุณภาพโมเดลลดลง

รหัส YDF
ใน YDF คุณสามารถดูความสำคัญของตัวแปรของรูปแบบได้โดยเรียกใช้ model.describe() แล้วดูแท็บ "ความสำคัญของตัวแปร" ดูรายละเอียดเพิ่มเติมได้ใน ตัวอย่างการทำความเข้าใจโมเดล