أشجار القرارات

تتكون نماذج غابة القرارات من أشجار القرارات. غابة القرارات (مثل الغابات العشوائية) التي تعتمد، جزئيًا على الأقل، على تعلم أشجار القرارات.

في هذا القسم من الدورة، ستدرس مثالًا لمجموعة بيانات صغيرة، وتتعرف على كيفية تدريب شجرة قرارات واحدة. في الأقسام التالية، ستتعلم كيفية ثم دمج أشجار القرارات لتدريب غابات القرارات.

رمز YDF

في YDF، استخدم متعلم CART لتدريب نماذج شجرة القرارات الفردية:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

النموذج

شجرة القرار هي نموذج مكوّن من مجموعة من "الأسئلة" منظم بشكل هرمي على شكل شجرة. عادةً ما يُطلق على الأسئلة condition أو split أو test. سنستخدم مصطلح "الحالة" بوصة هذا الفصل الدراسي. يحتوي كل عقدة ليس لها صفة ورقة على شرط، وتحتوي كل عقدة غير الورقة على توقع.

تنمو الأشجار النباتية عمومًا مع جذورها في القاع؛ لكن القرار يتم تمثيل الأشجار عادةً باستخدام الجذر (العقدة الأولى) في الأعلى.

شجرة قرارات تحتوي على شرطين وثلاث أوراق. الأول
الشرط (الجذر) هو num_legs >= 3؛ والشرط الثاني هو
num_eyes >= 3. والأوراق الثلاث هي البطريق والعنكبوت
وكلب.

الشكل 1. يشير ذلك المصطلح إلى شجرة قرارات تصنيف بسيطة. وسيلة الإيضاح باللون الأخضر ليست جزءًا في شجرة القرار.

 

يتم حساب استنتاج نموذج شجرة القرارات من خلال توجيه مثال من الجذر (في الأعلى) إلى إحدى العُقد الورقية (في الجزء السفلي) حسب الظروف. قيمة الورقة التي تم الوصول إليها هي توقع شجرة القرارات. ويُطلق على مجموعة العُقد التي تمت زيارتها اسم مسار الاستنتاج. على سبيل المثال: ضع في الاعتبار قيم الخصائص التالية:

num_legs num_eyes
4 2

وسيكون التوقّع هو dog. سيكون مسار الاستنتاج كما يلي:

  1. num_legs ≥ 3 → نعم
  2. num_eyes ≥ 3 → لا

هذا الرسم التوضيحي نفسه كما في الشكل 1، ولكن هذا الرسم التوضيحي يعرض
  مسار استنتاجي عبر شرطين، وينتهي في ورقة الكلب.

الشكل 2. مسار الاستنتاج الذي يتوجّب في *كلب* ورقة الشجر في المثال *{num_legs : 4, num_eyes : 2}*.

 

في المثال السابق، تحتوي أوراق شجرة القرارات على التصنيف والتوقّعات أي أن كل ورقة تحتوي على نوع حيوان بين مجموعة الأنواع المحتملة.

وبالمثل، يمكن لأشجار القرارات التنبؤ بالقيم الرقمية من خلال تصنيف الأوراق باستخدام التوقعات الانحدارية (القيم الرقمية). على سبيل المثال، سيصدر القرار التالي تتنبأ شجرة بدرجة جاذبية حيوان ما بين 0 و10.

شجرة قرارات يحتوي فيها كل ورقة على نقطة عائمة مختلفة
  الصف.

الشكل 3. يشير ذلك المصطلح إلى شجرة قرارات ينتج عنها توقّع عددي.