تتكون نماذج غابة القرارات من أشجار القرارات. غابة القرارات (مثل الغابات العشوائية) التي تعتمد، جزئيًا على الأقل، على تعلم أشجار القرارات.
في هذا القسم من الدورة، ستدرس مثالًا لمجموعة بيانات صغيرة، وتتعرف على كيفية تدريب شجرة قرارات واحدة. في الأقسام التالية، ستتعلم كيفية ثم دمج أشجار القرارات لتدريب غابات القرارات.
في YDF، استخدم متعلم CART لتدريب نماذج شجرة القرارات الفردية:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
النموذج
شجرة القرار هي نموذج مكوّن من مجموعة من "الأسئلة" منظم بشكل هرمي على شكل شجرة. عادةً ما يُطلق على الأسئلة condition أو split أو test. سنستخدم مصطلح "الحالة" بوصة هذا الفصل الدراسي. يحتوي كل عقدة ليس لها صفة ورقة على شرط، وتحتوي كل عقدة غير الورقة على توقع.
تنمو الأشجار النباتية عمومًا مع جذورها في القاع؛ لكن القرار يتم تمثيل الأشجار عادةً باستخدام الجذر (العقدة الأولى) في الأعلى.
الشكل 1. يشير ذلك المصطلح إلى شجرة قرارات تصنيف بسيطة. وسيلة الإيضاح باللون الأخضر ليست جزءًا في شجرة القرار.
يتم حساب استنتاج نموذج شجرة القرارات من خلال توجيه مثال من الجذر (في الأعلى) إلى إحدى العُقد الورقية (في الجزء السفلي) حسب الظروف. قيمة الورقة التي تم الوصول إليها هي توقع شجرة القرارات. ويُطلق على مجموعة العُقد التي تمت زيارتها اسم مسار الاستنتاج. على سبيل المثال: ضع في الاعتبار قيم الخصائص التالية:
num_legs | num_eyes |
---|---|
4 | 2 |
وسيكون التوقّع هو dog. سيكون مسار الاستنتاج كما يلي:
- num_legs ≥ 3 → نعم
- num_eyes ≥ 3 → لا
الشكل 2. مسار الاستنتاج الذي يتوجّب في *كلب* ورقة الشجر في المثال *{num_legs : 4, num_eyes : 2}*.
في المثال السابق، تحتوي أوراق شجرة القرارات على التصنيف والتوقّعات أي أن كل ورقة تحتوي على نوع حيوان بين مجموعة الأنواع المحتملة.
وبالمثل، يمكن لأشجار القرارات التنبؤ بالقيم الرقمية من خلال تصنيف الأوراق باستخدام التوقعات الانحدارية (القيم الرقمية). على سبيل المثال، سيصدر القرار التالي تتنبأ شجرة بدرجة جاذبية حيوان ما بين 0 و10.
الشكل 3. يشير ذلك المصطلح إلى شجرة قرارات ينتج عنها توقّع عددي.