সিদ্ধান্ত বন জন্য উপযুক্ত তথ্য

ডিসিশন ফরেস্ট সবচেয়ে কার্যকর হয় যখন আপনার কাছে একটি ট্যাবুলার ডেটাসেট থাকে (যে ডেটা আপনি স্প্রেডশীট, csv ফাইল বা ডাটাবেস টেবিলে উপস্থাপন করতে পারেন)। ট্যাবুলার ডেটা হল সবচেয়ে সাধারণ ডেটা ফর্ম্যাটগুলির মধ্যে একটি, এবং সিদ্ধান্তের বনগুলি এটিকে মডেল করার জন্য আপনার "গো-টু" সমাধান হওয়া উচিত।

সারণি 1. একটি ট্যাবুলার ডেটাসেটের উদাহরণ।

পায়ের সংখ্যা চোখের সংখ্যা ওজন পাউন্ডে) প্রজাতি (লেবেল)
2 2 12 পেঙ্গুইন
8 6 0.1 মাকড়সা
4 2 44 কুকুর

নিউরাল নেটওয়ার্কের বিপরীতে, সিদ্ধান্ত বন স্থানীয়ভাবে মডেল ট্যাবুলার ডেটা ব্যবহার করে। সিদ্ধান্ত বন উন্নয়ন করার সময়, আপনাকে নিম্নলিখিতগুলির মতো কাজগুলি করতে হবে না:

  • বৈশিষ্ট্য স্বাভাবিককরণ বা এক-হট এনকোডিংয়ের মতো প্রিপ্রসেসিং সম্পাদন করুন।
  • অভিযোজন সম্পাদন করুন (উদাহরণস্বরূপ, -1 এর সাথে একটি অনুপস্থিত মান প্রতিস্থাপন করা)।

যাইহোক, ডিসিশন ফরেস্টগুলি সরাসরি নন-টেবুলার ডেটা (যাকে অসংগঠিত ডেটাও বলা হয়), যেমন ছবি বা পাঠ্য ব্যবহার করার জন্য উপযুক্ত নয়। হ্যাঁ, এই সীমাবদ্ধতার জন্য সমাধানগুলি বিদ্যমান, তবে নিউরাল নেটওয়ার্কগুলি সাধারণত অসংগঠিত ডেটা আরও ভালভাবে পরিচালনা করে।

কর্মক্ষমতা

সিদ্ধান্ত বন নমুনা দক্ষ. অর্থাৎ, সিদ্ধান্তের বনগুলি ছোট ডেটাসেট বা ডেটাসেটের উপর প্রশিক্ষণের জন্য উপযুক্ত যেখানে বৈশিষ্ট্যের সংখ্যা / উদাহরণের সংখ্যার অনুপাত বেশি (সম্ভবত 1 এর বেশি)। যদিও ডিসিশন ফরেস্টগুলি নমুনা দক্ষ, সমস্ত মেশিন লার্নিং মডেলের মতো, যখন প্রচুর ডেটা পাওয়া যায় তখন ডিসিশন ফরেস্ট সেরা কাজ করে৷

সিদ্ধান্ত বন সাধারণত তুলনামূলক নিউরাল নেটওয়ার্কের চেয়ে দ্রুত অনুমান করে। উদাহরণস্বরূপ, একটি মাঝারি আকারের সিদ্ধান্ত বন একটি আধুনিক CPU-তে কয়েক মাইক্রোসেকেন্ডের মধ্যে অনুমান চালায়।