এলোমেলো বন, এলোমেলো বন

এটি একটি ষাঁড়।

An old, old photograph of an ox.

চিত্র 19. একটি বলদ।

1906 সালে, ইংল্যান্ডে একটি ওজন বিচার প্রতিযোগিতা অনুষ্ঠিত হয় । 787 জন অংশগ্রহণকারী একটি ষাঁড়ের ওজন অনুমান করেছিলেন। স্বতন্ত্র অনুমানের মধ্যকার ত্রুটি ছিল 37 পাউন্ড (3.1% এর একটি ত্রুটি)। যাইহোক, অনুমানের সামগ্রিক মাঝামাঝি ষাঁড়ের প্রকৃত ওজন (1198 পাউন্ড) থেকে মাত্র 9 পাউন্ড দূরে ছিল, যা শুধুমাত্র 0.7% এর ত্রুটি ছিল।

Histogram of individual guesses, showing most guesses clustered around
the actual weight of the ox.

চিত্র 20. স্বতন্ত্র ওজন অনুমানের হিস্টোগ্রাম।

এই উপাখ্যানটি জনতার বুদ্ধিকে চিত্রিত করে: কিছু পরিস্থিতিতে, সম্মিলিত মতামত খুব ভাল রায় প্রদান করে।

গাণিতিকভাবে, ভিড়ের জ্ঞানকে কেন্দ্রীয় সীমা উপপাদ্যের সাথে মডেল করা যেতে পারে: অনানুষ্ঠানিকভাবে, একটি মান এবং এই মানের এন গোলমালের গড় অনুমানের মধ্যে বর্গক্ষেত্র ত্রুটি একটি 1/N ফ্যাক্টর সহ শূন্যে থাকে। যাইহোক, যদি ভেরিয়েবলগুলি স্বাধীন না হয় তবে প্রকরণটি বেশি হয়।

মেশিন লার্নিং-এ, এনসেম্বল হল মডেলের একটি সংগ্রহ যার ভবিষ্যদ্বাণীগুলি গড় করা হয় (বা কোনোভাবে একত্রিত করা হয়)। যদি এনসেম্বল মডেলগুলি স্বতন্ত্রভাবে খুব খারাপ না হয়ে যথেষ্ট আলাদা হয়, তবে এনসেম্বলের গুণমান সাধারণত প্রতিটি পৃথক মডেলের মানের চেয়ে ভাল হয়। একটি ensemble একটি একক মডেল তুলনায় আরো প্রশিক্ষণ এবং অনুমান সময় প্রয়োজন. সর্বোপরি, আপনাকে একটি একক মডেলের পরিবর্তে একাধিক মডেলের প্রশিক্ষণ এবং অনুমান করতে হবে।

অনানুষ্ঠানিকভাবে, একটি ensemble সর্বোত্তম কাজ করার জন্য, পৃথক মডেলগুলি স্বাধীন হওয়া উচিত। একটি দৃষ্টান্ত হিসাবে, 10টি হুবহু একই মডেলের সমন্বয়ে গঠিত একটি ensemble (অর্থাৎ, মোটেও স্বাধীন নয়) পৃথক মডেলের চেয়ে ভাল হবে না। অন্যদিকে, মডেলগুলিকে স্বাধীন হতে বাধ্য করার অর্থ তাদের আরও খারাপ করা হতে পারে। কার্যকরী এনসেম্বলিং এর জন্য মডেলের স্বাধীনতা এবং এর সাব-মডেলের মানের মধ্যে ভারসাম্য খুঁজে বের করতে হবে।