الغابة العشوائية

هذا صوت ثور.

صورة قديمة جدًا لحصان

الشكل 19. ثور.

 

في عام 1906، تم تنظيم مسابقة لتقييم الوزن في إنجلترا. توقّع 787 مشاركًا وزن ثور. كان متوسّط الخطأ في التخمينات الفردية يتراوح بين 17 و17.9 كيلوغرام (أي خطأ بنسبة 3.1%). ومع ذلك، كان متوسّط التقييمات العامة يقلّ عن الوزن الفعلي للثور (1198 رطل) بمقدار 9 رطل فقط، ما يمثّل اختلافًا نسبته 0.7% فقط.

رسم بياني للتردد التكراري للتوقّعات الفردية، يعرض معظم التوقّعات التي تركّزت حول
الوزن الفعلي للثور

الشكل 20: مخطّط بياني هرمي للوزن المقدَّر لكل فرد

 

توضّح هذه الحكاية حكمة الحشود: في مواقف معيّنة، يقدّم الرأي الجماعي حكمًا جيدًا جدًا.

من الناحية الحسابية، يمكن وضع نموذج لحكمة الحشود باستخدام نظرية الحدّ المركزي: بشكل غير رسمي، يميل الخطأ التربيعي بين قيمة ومتوسط N تخمينات صاخبة لهذه القيمة إلى الصفر مع عامل 1/N. ومع ذلك، إذا لم تكن المتغيرات مستقلة، يكون التباين أكبر.

في تعلُّم الآلة، يشير مصطلح النموذج المجمّع إلى مجموعة من النماذج التي يتم احتساب متوسط توقعاتها (أو تجميعها بطريقة ما). إذا كانت نماذج المجموعة مختلفة بما يكفي بدون أن تكون سيئة جدًا بشكل فردي، تكون جودة المجموعة بشكل عام أفضل من جودة كل نماذج الفردية. تتطلّب المجموعة وقتًا أطول للتدريب والاستنتاج مقارنةً بأحد نماذج الأداء الفردية. بعد كل شيء، عليك إجراء عمليات التدريب والاستنتاج على نماذج متعدّدة بدلاً من نموذج واحد.

بشكل غير رسمي، لكي تعمل المجموعة على أفضل وجه، يجب أن تكون النماذج الفردية مستقلة. على سبيل المثال، لن تكون المجموعة التي تتألف من 10 نماذج متطابقة تمامًا (أي ليست مستقلة على الإطلاق) أفضل من النموذج الفردي. من ناحية أخرى، قد يؤدي فرض استقلالية النماذج إلى تحسين أدائها. تتطلّب عملية الدمج الفعّالة تحقيق التوازن بين استقلالية النموذج وجودة النماذج الفرعية.