اهمیت های متغیر

اهمیت متغیر (همچنین به عنوان اهمیت ویژگی شناخته می شود) امتیازی است که نشان می دهد یک ویژگی برای مدل چقدر "مهم" است. به عنوان مثال، اگر برای یک مدل معین با دو ویژگی ورودی "f1" و "f2"، اهمیت متغیرها {f1=5.8, f2=2.5} باشد، پس ویژگی "f1" برای مدل مهمتر از ویژگی است. "f2". مانند سایر مدل‌های یادگیری ماشین، اهمیت متغیر یک راه ساده برای درک نحوه عملکرد درخت تصمیم است.

شما می توانید اهمیت متغیرهای آگنوستیک مدل مانند اهمیت متغیرهای جایگشتی را برای درختان تصمیم اعمال کنید.

درختان تصمیم نیز دارای اهمیت متغیر خاصی هستند، مانند:

  • مجموع نمره تقسیم با یک متغیر معین.
  • تعداد گره ها با یک متغیر معین.
  • میانگین عمق اولین وقوع یک ویژگی در تمام مسیرهای درختی.

اهمیت متغیر می تواند با کیفیت هایی مانند:

  • مفاهیم
  • مقیاس
  • خواص

علاوه بر این، اهمیت متغیر انواع مختلفی از اطلاعات را در مورد:

  • مدل
  • مجموعه داده
  • روند آموزش

به عنوان مثال، تعداد شرایط حاوی یک ویژگی خاص نشان می دهد که درخت تصمیم چقدر به این ویژگی خاص نگاه می کند، که ممکن است نشان دهنده اهمیت متغیر باشد. به هر حال، الگوریتم یادگیری اگر مهم نبود از یک ویژگی در شرایط چندگانه استفاده نمی کرد. با این حال، همان ویژگی که در شرایط چندگانه ظاهر می‌شود ممکن است نشان‌دهنده این باشد که یک مدل تلاش می‌کند، اما در تعمیم الگوی یک ویژگی ناکام است. به عنوان مثال، این می تواند زمانی اتفاق بیفتد که یک ویژگی فقط یک شناسه نمونه باشد که هیچ اطلاعاتی برای تعمیم ندارد.

از سوی دیگر، یک مقدار بالا برای اهمیت متغیر جایگشت بالا نشان می‌دهد که حذف یک ویژگی به مدل آسیب می‌زند، که نشانه‌ای از اهمیت متغیر است. با این حال، اگر مدل قوی باشد، حذف هر یک از ویژگی‌ها ممکن است به مدل آسیبی نرساند.

از آنجایی که اهمیت متغیرهای مختلف در مورد جنبه‌های مختلف مدل‌ها اطلاعات می‌دهد، نگاه کردن به چندین اهمیت متغیر به طور همزمان آموزنده است. به عنوان مثال، اگر یک ویژگی با توجه به همه اهمیت های متغیر مهم باشد، این ویژگی احتمالا مهم است. به عنوان مثال دیگر، اگر یک ویژگی دارای اهمیت متغیر "تعداد گره" بالا و اهمیت متغیر "جایگشت" کوچک باشد، تعمیم این ویژگی ممکن است سخت باشد و به کیفیت مدل آسیب برساند.

کد YDF
در YDF، می توانید با فراخوانی model.describe() و نگاه کردن به تب "variable important" اهمیت متغیر یک مدل را ببینید. برای جزئیات بیشتر به آموزش درک مدل مراجعه کنید.