التقييم خارج العلبة
لا تتطلّب الغابات العشوائية مجموعة بيانات للتحقّق من الصحة. تستخدِم معظم الغابات العشوائية تقنية تُعرَف باسم التقييم خارج الحقيبة (تقييم خارج الحقيبة) لتقييم جودة النموذج. يتعامل تقييم البيانات خارج النطاق مع مجموعة التدريب كما لو كانت في مجموعة اختبار التحقق التبادلي.
كما هو موضّح سابقًا، يتم عادةً تدريب كل شجرة قرارات في الغابة العشوائية على% 67 تقريبًا من أمثلة التدريب. وبالتالي، لا ترى كل شجرة قرارات% 33 تقريبًا من أمثلة التدريب. في ما يلي الفكرة الأساسية للتقييم خارج النطاق:
- لتقييم الغابة العشوائية في مجموعة التدريب
- لكل مثال، استخدِم فقط أشجار القرارات التي لم تَظهر لها المثال أثناء التدريب.
يوضِّح الجدول التالي تقييمًا خارج النطاق لحديقة عشوائية تتضمّن 3 أشجار قرارات تم تدريبها على 6 أمثلة. (نعم، هذا هو الجدول نفسه الوارد في قسم "التجميع"). يعرض الجدول شجرة القرار التي يتم استخدامها مع المثال أثناء التقييم خارج النطاق.
الجدول 7: تقييم خارج النطاق: تمثل الأرقام عدد المرات التي يتم فيها استخدام مثال تدريبي معيّن أثناء تدريب المثال المعيّن.
أمثلة على التدريب | أمثلة على التقييم خارج النطاق | ||||||
---|---|---|---|---|---|---|---|
#1 | #2 | #3 | #4 | #5 | #6 | ||
مجموعة البيانات الأصلية | 1 | 1 | 1 | 1 | 1 | 1 | |
شجرة القرار 1 | 1 | 1 | 0 | 2 | 1 | 1 | #3 |
شجرة القرار 2 | 3 | 0 | 1 | 0 | 2 | 0 | #2 و#4 و #6 |
شجرة القرار 3 | 0 | 1 | 3 | 1 | 0 | 1 | رقم 1 ورقم 5 |
في المثال الموضّح في الجدول 7، سيتم احتساب التوقّعات خارج النطاق لمثال التدريب 1 باستخدام شجرة القرار رقم 3 (لأنّ شجرتا القرار رقم 1 و2 استخدمتا هذا المثال للتدريب). في الممارسة العملية، في مجموعة بيانات ذات حجم معقول وباستخدام بضع أشجار قرارات، تتضمّن جميع الأمثلة توقّعات خارج النطاق.
compute_oob_performances=True
.
يُعدّ تقييم خارج النطاق فعّالاً أيضًا لاحتساب أهمية متغيّر التبادل ل نماذج الغابة العشوائية. من أهمية المتغيّرات، تذكَّر أنّ أهمية متغيّر الترتيب العشوائي تقيس أهمية متغيّر من خلال قياس انخفاض جودة النموذج عند ترتيب هذا المتغيّر عشوائيًا. "أهمية متغيّر الترتيب العشوائي خارج النطاق (OOB)" في الغابة العشوائية هي أهمية متغيّر الترتيب العشوائي يتم احتسابها باستخدام التقييم خارج النطاق.
compute_oob_variable_importances=True
.