أشجار القرارات

تتألّف نماذج غابات القرارات من أشجار القرارات. تعتمد خوارزميات تعلُّم انماط الأشجار القرارية (مثل الغابات العشوائية) على الأقل جزئيًا على تعلُّم أشجار القرارات.

في هذا القسم من الدورة التدريبية، ستدرس مثالاً صغيرًا على مجموعة بيانات، وستتعرّف على كيفية تدريب شجرة قرارات واحدة. في الأقسام التالية، ستتعرّف على كيفية دمج أشجار القرارات لتدريب غابات القرارات.

رمز YDF

في YDF، استخدِم أداة تعلُّم CART لتدريب نماذج شجرة قرارات فردية:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

النموذج

شجرة القرارات هي نموذج يتألّف من مجموعة من "الأسئلة" المنظَّمة بشكل هرمي في شكل شجرة. تُعرف الأسئلة عادةً باسم شرط أو تقسيم أو اختبار. سنستخدم مصطلح "الحالة" في هذه الفئة. تحتوي كل عقدة غير ورقية على شرط، وتحتوي كل عقدة ورقية على توقّع.

تنمو الأشجار النباتية بشكل عام مع الجذر في أسفل الشجرة، ولكن يتم عادةً تمثيل أشجار القرار مع الجذر (العقدة الأولى) في الأعلى.

شجرة قرارات تحتوي على شرطَين وثلاث أوراق الشرط الأول (الجذر) هو num_legs >= 3، والشرط الثاني هو
num_eyes >= 3. الأوراق الثلاث هي البطريق والعنكبوت
والكلب.

الشكل 1: شجرة قرار تصنيف بسيطة لا يشكّل الرمز التوضيحي باللون الأخضر جزءًا من شجرة القرارات.

 

يتم احتساب الاستنتاج من نموذج شجرة القرار من خلال توجيه مثال من الجذر (في الأعلى) إلى إحدى العقد الورقية (في الأسفل) وفقًا ل الشروط. وقيمة الورقة التي تم الوصول إليها هي توقّع شجرة القرارات. تُعرف مجموعة العقد التي تمت زيارتها باسم مسار الاستنتاج. على سبيل المثال، نأخذ في الاعتبار قيم السمات التالية:

num_legs num_eyes
4 2

سيكون التنبؤ هو كلب. سيكون مسار الاستنتاج على النحو التالي:

  1. num_legs ≥ 3 → نعم
  2. num_eyes ≥ 3 → لا

الصورة التوضيحية نفسها في الشكل 1، ولكن هذه الصورة التوضيحية تعرض
  مسار الاستنتاج على مستوى شرطَين، وتنتهي في ورقة الكلب.

الشكل 2: مسار الاستنتاج الذي ينتهي بالعنصر الورقي *dog* في المثال *{num_legs : 4, num_eyes : 2}*.

 

في المثال السابق، تحتوي أوراق شجرة القرار على توقّعات التصنيف، أي أنّ كل ورقة تحتوي على نوع حيوان من بين مجموعة من الأنواع المحتملة.

وبالمثل، يمكن لأشجار القرارات توقّع القيم الرقمية من خلال تصنيف الأوراق باستخدام التوقّعات التنازلية (القيم الرقمية). على سبيل المثال، تتوقّع شجرة اتّخاذ القرار التالية نتيجة رقمية لمدى ظرافة الحيوان تتراوح بين 0 و10.

شجرة قرارات تحتوي كل ورقة فيها على عدد مختلف بفاصل عشري

الشكل 3. شجرة قرارات تُجري توقّعات رقمية