تتألّف نماذج غابات القرارات من أشجار القرارات. تعتمد خوارزميات تعلُّم انماط الأشجار القرارية (مثل الغابات العشوائية) على الأقل جزئيًا على تعلُّم أشجار القرارات.
في هذا القسم من الدورة التدريبية، ستدرس مثالاً صغيرًا على مجموعة بيانات، وستتعرّف على كيفية تدريب شجرة قرارات واحدة. في الأقسام التالية، ستتعرّف على كيفية دمج أشجار القرارات لتدريب غابات القرارات.
في YDF، استخدِم أداة تعلُّم CART لتدريب نماذج شجرة قرارات فردية:
# https://ydf.readthedocs.io/en/latest/py_api/CartLearner import ydf model = ydf.CartLearner(label="my_label").train(dataset)
النموذج
شجرة القرارات هي نموذج يتألّف من مجموعة من "الأسئلة" المنظَّمة بشكل هرمي في شكل شجرة. تُعرف الأسئلة عادةً باسم شرط أو تقسيم أو اختبار. سنستخدم مصطلح "الحالة" في هذه الفئة. تحتوي كل عقدة غير ورقية على شرط، وتحتوي كل عقدة ورقية على توقّع.
تنمو الأشجار النباتية بشكل عام مع الجذر في أسفل الشجرة، ولكن يتم عادةً تمثيل أشجار القرار مع الجذر (العقدة الأولى) في الأعلى.
الشكل 1: شجرة قرار تصنيف بسيطة لا يشكّل الرمز التوضيحي باللون الأخضر جزءًا من شجرة القرارات.
يتم احتساب الاستنتاج من نموذج شجرة القرار من خلال توجيه مثال من الجذر (في الأعلى) إلى إحدى العقد الورقية (في الأسفل) وفقًا ل الشروط. وقيمة الورقة التي تم الوصول إليها هي توقّع شجرة القرارات. تُعرف مجموعة العقد التي تمت زيارتها باسم مسار الاستنتاج. على سبيل المثال، نأخذ في الاعتبار قيم السمات التالية:
num_legs | num_eyes |
---|---|
4 | 2 |
سيكون التنبؤ هو كلب. سيكون مسار الاستنتاج على النحو التالي:
- num_legs ≥ 3 → نعم
- num_eyes ≥ 3 → لا
الشكل 2: مسار الاستنتاج الذي ينتهي بالعنصر الورقي *dog* في المثال *{num_legs : 4, num_eyes : 2}*.
في المثال السابق، تحتوي أوراق شجرة القرار على توقّعات التصنيف، أي أنّ كل ورقة تحتوي على نوع حيوان من بين مجموعة من الأنواع المحتملة.
وبالمثل، يمكن لأشجار القرارات توقّع القيم الرقمية من خلال تصنيف الأوراق باستخدام التوقّعات التنازلية (القيم الرقمية). على سبيل المثال، تتوقّع شجرة اتّخاذ القرار التالية نتيجة رقمية لمدى ظرافة الحيوان تتراوح بين 0 و10.
الشكل 3. شجرة قرارات تُجري توقّعات رقمية