البيانات المناسبة لغابات اتخاذ القرارات

تكون مجموعات القرارات أكثر فعالية عندما يكون لديك مجموعة بيانات جدولية (البيانات التي قد تمثلها في جدول بيانات أو ملف csv أو جدول قاعدة بيانات). تُعدّ البيانات الجدولية من أكثر تنسيقات البيانات شيوعًا، ويجب أن تكون مجموعات القرارات هي "الحلول المقترَحة" لوضع نماذج لها.

الجدول 1. مثال على مجموعة بيانات جدولية.

عدد الأرجل عدد العينين الوزن (رطل) الأنواع (التصنيف)
2 2 12 بطريق
8 6 0.1 عنكبوت
4 2 44 كلب

وعلى عكس الشبكات العصبونية، تستهلك غابات القرار في الأصل بيانات جدولية للنماذج. عند تطوير غابات القرارات، ليس عليك تنفيذ مهام مثل ما يلي:

  • نفِّذ المعالجة المسبقة، مثل تسوية الميزات أو ترميز المحتوى الواحد.
  • إجراء عملية تشكيل (على سبيل المثال، استبدال قيمة ناقصة بـ -1)

ومع ذلك، فإن غابات القرارات غير مناسبة تمامًا لاستهلاك البيانات غير الجدولية مباشرةً (المعروفة أيضًا باسم البيانات غير المنظَّمة)، مثل الصور أو النصوص. نعم، هناك حلول بديلة لهذه القيود، ولكن الشبكات العصبونية تتعامل بشكل عام مع البيانات غير المنظَّمة بشكل أفضل.

الأداء

تتميّز غابات القرارات بأنّها نموذج فعّال. بمعنى أن غابات القرارات مناسبة تمامًا للتدريب على مجموعات البيانات الصغيرة أو على مجموعات البيانات التي تكون فيها نسبة الميزات أو عدد الأمثلة عالية (ربما أكبر من 1). على الرغم من أن غابات القرارات نموذجية فعّالة، مثل جميع نماذج تعلُم الآلة، إلا أن غابات القرارات تحقّق أفضل أداء عند توفّر الكثير من البيانات.

تستنتج غابات القرارات عادةً بشكل أسرع من الشبكات العصبية المشابهة. على سبيل المثال، تستغرِق مجموعة القرارات المتوسطة الحجم استنتاجًا في بضع ثوانٍ على وحدة معالجة مركزية حديثة.