فيما يلي ملخص سريع لما تعلمته في الدورة:
- شجرة القرار هي نموذج
تتكون من مجموعة من
الشروط منظّمة
بشكل هرمي على شكل شجرة. تنقسم الظروف إلى عدة
الفئات:
- محاذاة المحور الحالة تتضمّن ميزة واحدة فقط. مائل الحالة تتضمّن ميزات متعددة.
- برنامج ثنائي الحالة لها شرطان محتملان والنتائج. برنامج غير ثنائي الشرط أكثر من نتيجتين محتملتين.
- يتضمن تدريب شجرة القرار البحث عن أفضل حالة في كل عقدة. سلسلة إجراءات التقسيم مقاييس مثل المعلومات اكتساب أو Gini لتحديد الأفضل الشرط.
- غابة القرارات هي وضع مكون من أشجار قرارات متعددة. التنبؤ بغابة القرارات هو تجميع التنبؤات بأشجار القرارات.
- الغابة العشوائية هي مجموعة من أشجار القرارات يتم فيها تدريب كل شجرة قرارات باستخدام ضوضاء عشوائية محددة.
- التجميع هو أسلوب يتم تدريب كل شجرة قرارات في الغابة العشوائية على مجموعة فرعية مختلفة من الأمثلة.
- لا تتطلب الغابات العشوائية مجموعة بيانات تحقق من الصحة. بدلاً من ذلك، فإن معظم فإن الغابات تستخدم تقنية تسمى out-of-bag-evaluation لتقييم جودة النموذج.
- تدرج معزز (قرار) شجرة هي نوع من غابة القرارات مدربة من خلال تعديلات تكرارية من المدخلات وأشجار القرارات. قيمة تسمى shrinkage تتحكم في المعدل في التي تتعلمها شجرة التدرج لتعزيز (القرار) والدرجة التي يمكن أن يكون أكثر من اللازم.
المراجع
- التقدير التقريبي للدالة المتدرجة: تعزيز متدرج Machine، ي. فريدمان.
- العناصر الإحصائية التعلّم، تريفور هاستي. الفصل 10:
- النماذج المحسّنة العامة: دليل حول Google Cloud Platform الطرد، الْبَوَّابَة Ridgeway