সিদ্ধান্ত গাছ

সিদ্ধান্ত বন মডেল সিদ্ধান্ত গাছ গঠিত হয়. সিদ্ধান্ত বন শেখার অ্যালগরিদম (যেমন এলোমেলো বন) নির্ভর করে, অন্তত আংশিকভাবে, সিদ্ধান্ত গাছ শেখার উপর।

কোর্সের এই বিভাগে, আপনি একটি ছোট উদাহরণ ডেটাসেট অধ্যয়ন করবেন, এবং শিখবেন কিভাবে একটি একক সিদ্ধান্ত গাছকে প্রশিক্ষিত করা হয়। পরবর্তী বিভাগগুলিতে, আপনি শিখবেন কীভাবে সিদ্ধান্তের গাছগুলিকে সিদ্ধান্তের বনকে প্রশিক্ষণ দেওয়ার জন্য একত্রিত করা হয়।

YDF কোড

YDF-এ, পৃথক সিদ্ধান্ত গাছের মডেল প্রশিক্ষণের জন্য CART লার্নার ব্যবহার করুন:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

মডেল

একটি সিদ্ধান্ত গাছ হল একটি মডেল যা একটি গাছের আকারে ক্রমানুসারে সংগঠিত "প্রশ্ন" সংগ্রহের সমন্বয়ে গঠিত। প্রশ্নগুলোকে সাধারণত শর্ত, বিভক্ত বা পরীক্ষা বলা হয়। আমরা এই ক্লাসে "শর্ত" শব্দটি ব্যবহার করব। প্রতিটি নন-লিফ নোডে একটি শর্ত থাকে এবং প্রতিটি লিফ নোডে একটি ভবিষ্যদ্বাণী থাকে।

বোটানিক্যাল বৃক্ষ সাধারণত নীচে শিকড় সঙ্গে বৃদ্ধি; যাইহোক, ডিসিশন ট্রিগুলি সাধারণত শীর্ষে মূল (প্রথম নোড) দিয়ে উপস্থাপন করা হয়।

A decision tree containing two conditions and three leaves. The first
condition (the root) is num_legs >= 3; the second condition is
num_eyes >= 3. The three leaves are penguin, spider,
and dog.

চিত্র 1. একটি সহজ শ্রেণিবিন্যাস সিদ্ধান্ত গাছ। সবুজে কিংবদন্তি সিদ্ধান্ত গাছের অংশ নয়।

একটি সিদ্ধান্ত গাছের মডেলের অনুমান শর্ত অনুযায়ী মূল থেকে (উপরে) পাতার নোডগুলির একটিতে (নীচে) একটি উদাহরণ রাউটিং করে গণনা করা হয়। পৌঁছে যাওয়া পাতার মান হল সিদ্ধান্ত গাছের পূর্বাভাস। পরিদর্শন করা নোডের সেটকে ইনফারেন্স পাথ বলা হয়। উদাহরণস্বরূপ, নিম্নলিখিত বৈশিষ্ট্য মান বিবেচনা করুন:

সংখ্যা_পা সংখ্যা_চোখ
4 2

ভবিষ্যদ্বাণী কুকুর হবে. অনুমান পথ হবে:

  1. num_legs ≥ 3 → হ্যাঁ
  2. num_eyes ≥ 3 → না

The same illustration as Figure 1, but this illustration shows the
  inference path across two conditions, terminating in the leaf for dog.

চিত্র 2. অনুমান পথ যা পাতায় শেষ হয় *কুকুর* উদাহরণে *{num_legs : 4, num_eyes : 2}*।

পূর্ববর্তী উদাহরণে, সিদ্ধান্ত গাছের পাতায় শ্রেণীবিভাগের পূর্বাভাস রয়েছে; অর্থাৎ, প্রতিটি পাতায় সম্ভাব্য প্রজাতির একটি সেটের মধ্যে একটি প্রাণীর প্রজাতি রয়েছে।

একইভাবে, সিদ্ধান্ত বৃক্ষ পশ্চাদগামী ভবিষ্যদ্বাণী (সংখ্যাসূচক মান) সহ পাতাগুলিকে লেবেল করে সংখ্যাসূচক মানগুলির পূর্বাভাস দিতে পারে। উদাহরণস্বরূপ, নিম্নলিখিত সিদ্ধান্ত গাছটি 0 এবং 10-এর মধ্যে একটি প্রাণীর সংখ্যাগত সূক্ষ্মতার স্কোর ভবিষ্যদ্বাণী করে।

A decision tree in which each leaf contains a different floating-point
  number.

চিত্র 3. একটি সিদ্ধান্ত গাছ যা সংখ্যাসূচক ভবিষ্যদ্বাণী করে।