تكون غابات القرارات أكثر فعالية عندما يكون لديك مجموعة بيانات جدولية (بيانات قد تمثلها في جدول بيانات أو ملف csv أو جدول قاعدة بيانات). البيانات في شكل جداول هي أحد أكثر تنسيقات البيانات شيوعًا، ومن المفترض أن تكون غابات القرارات هي "الحلّ المفضّل" لنمذجة هذه البيانات.
الجدول 1: مثال على مجموعة بيانات على شكل جدول.
عدد المراحل | عدد العيون | الوزن (رطل) | النوع (تصنيف) |
---|---|---|---|
2 | 2 | 12 | بطريق |
8 | 6 | 0.1 | عنكبوت |
4 | 2 | 44 | كلب |
… | … | … | … |
على عكس الشبكات العصبية، تستخدِم غابات القرارات بشكلٍ أساسي بيانات نموذجية في شكل جداول. عند تطوير غابات القرارات، ليس عليك تنفيذ مهام مثل ما يلي:
- نفِّذ المعالجة المُسبَقة، مثل تسويت الميزات أو الترميز الواحد النشط.
- نفِّذ الاستبدال (على سبيل المثال، استبدال قيمة غير متوفّرة بـ
-1
).
ومع ذلك، لا تُعدّ غابات القرارات مناسبة لاستخدام البيانات غير المُجدوَلة بشكل مباشر (المعروفة أيضًا باسم البيانات غير المهيكلة)، مثل الصور أو النصوص. نعم، هناك إجراءات بديلة للتغلب على هذا الحدّ، ولكن الشبكات العصبية تعالج بشكل عام البيانات غير المهيكلة بشكل أفضل.
الأداء
تُعدّ غابات القرارات فعّالة في استخدام العيّنات. وهذا يعني أنّ غابات القرارات مناسبة تمامًا للتدريب على مجموعات بيانات صغيرة أو على مجموعات بيانات تكون فيها نسبة عدد السمات إلى عدد الأمثلة مرتفعة (قد تكون أكبر من 1). على الرغم من أنّ غابات القرارات فعّالة في استخدام عيّنات البيانات، مثل جميع نماذج تعلُّم الآلة، فإنّ غابات القرارات تحقّق أفضل أداء عندما تتوفّر الكثير من البيانات.
تُجري غابات القرارات عادةً الاستنتاجات بشكل أسرع من الشبكات العصبية المشابهة. على سبيل المثال، تُجري غابة القرارات متوسطة الحجم عملية الاستنتاج في بضع مللي ثانية على وحدة معالجة مركزية حديثة.