في ما يلي ملخّص سريع لما تعلمته في الدورة التدريبية:
- شجرة القرار هي نموذج
يتألّف من مجموعة من
الشروط المنظَّمة
بشكل هرمي في شكل شجرة. تندرج الشروط ضمن
فئات مختلفة:
- حالة ALIGNED_TO_AXIS: تتضمن ميزة واحدة فقط. حالة مائل: تتضمن ميزات متعدّدة.
- يكون شرط ثنائي له نتيجة محتملتان. يحتوي حال فجائي غير ثنائي على أكثر من نتيجتَين محتملتَين.
- يتضمن تدريب شجرة قرارات البحث عن أفضل شرط في كل عقدة. يستخدم الإجراء المقسّم مقاييس مثل مقياس ازدياد المعلومات أو مقياس جينّي لتحديد أفضل شرط.
- غابة القرارات هي وضع مكوّن من أشجار قرارات متعددة. التنبؤ بغابة القرارات هو جمع التنبؤات لأشجارها.
- الغابة العشوائية هي مجموعة من أشجار القرارات يتم فيها تدريب كل شجرة قرارات باستخدام ضوضاء عشوائية محدّدة.
- التجميع هو أسلوب يتم فيه تدريب كل شجرة قرار في الغابة العشوائية على مجموعة فرعية مختلفة من الأمثلة.
- لا تتطلّب الغابات العشوائية مجموعة بيانات للتحقّق من الصحة. بدلاً من ذلك، تستخدم معظم تقنيات الغابات العشوائية تقنية تُعرف باسم out-of-bag-evaluation لتقييم جودة النموذج.
- شجرة (قرار) متعزّزة بالانحدار هي نوع من غابات القرارات التي يتم تدريبها من خلال تعديلات متكرّرة من أشجار (قرارات) الإدخال. تتحكّم قيمة تُسمى الانكماش في معدّل التعلم لشجرة (قرارات) محسَّنة بالانحدار ودرجة التفاوت الذي يمكن أن تحدثه.
المراجع
- Greedy Function Approximation: A Gradient Boosting Machine، J. فريدمان.
- The Elements of Statistical Learning، Trevor Hastie الفصل 10
- النماذج المحسَّنة بشكل عام: دليل لحزمة gbm، G. Ridgeway