أشجار القرارات

تتكون نماذج غابات القرار من أشجار القرارات. تعتمد خوارزميات تعلم غابات القرار (مثل الغابات العشوائية) جزئيًا على الأقل على تعلُّم أشجار القرارات.

في هذا القسم من الدورة، سوف تدرس مجموعة بيانات صغيرة كمثال، وتتعلم كيفية تدريب شجرة قرار واحدة. في الأقسام التالية، ستتعلم كيفية دمج أشجار القرار لتدريب غابات القرار.

رمز YDF

في YDF، استخدم متعلم CART لتدريب نماذج شجرة القرار الفردية:

# https://ydf.readthedocs.io/en/latest/py_api/CartLearner
import ydf
model = ydf.CartLearner(label="my_label").train(dataset)

النموذج

شجرة القرار هي نموذج يتألّف من مجموعة من "الأسئلة" المنظّمة بشكل هرمي على شكل شجرة. وعادةً ما يُطلق على الأسئلة اسم شرط أو تقسيم أو اختبار. سنستخدم مصطلح "الحالة" في هذه الفئة. تحتوي كل جزء غير ورقة شجر على شرط، وكل جزء منها يحتوي على تنبؤ.

تنمو الأشجار النباتية بشكل عام وتكون جذورها في الأسفل، ولكن عادةً ما يتم تمثيل أشجار القرارات بالجذر (العقدة الأولى) في الأعلى.

شجرة قرار تحتوي على شرطين وثلاث أوراق. الشرط الأول (الجذر) هو num_legs >= 3؛ والشرط الثاني هو num_eyes >= 3. الأوراق الثلاث هي البطريق، والعناكب، والكلب.

الشكل 1. يشير ذلك المصطلح إلى شجرة قرارات تصنيف بسيطة. ولا تشكّل وسيلة الإيضاح ذات اللون الأخضر جزءًا من شجرة القرار.

 

يتم احتساب الاستنتاج من نموذج شجرة القرارات عن طريق توجيه مثال من الجذر (في الأعلى) إلى إحدى عقد الورقة (في الجزء السفلي) وفقًا للشروط. تمثل قيمة الورقة التي تم الوصول إليها تنبؤ شجرة القرارات. تُسمى مجموعة العُقد التي تمت زيارتها مسار الاستنتاج. على سبيل المثال، ضع في اعتبارك قيم الميزات التالية:

num_legs num_eyes
4 2

سيكون التوقّع هو كلب. سيكون مسار الاستنتاج:

  1. num_legs ≥ 3 ← نعم
  2. رقم_العيون ≥ 3 ← لا

هذه الصورة التوضيحية هي نفسها الواردة في الشكل 1، ولكنّ هذه الصورة التوضيحية تعرض
  مسار الاستنتاج في شرطين، وينتهي في ورقة الكلب.

الشكل 2. مسار الاستنتاج الذي يصل إلى ورق *كلب* في المثال *{num_legs : 4, num_eyes : 2}*.

 

في المثال السابق، تحتوي أوراق شجرة القرارات على تنبؤات التصنيف؛ أي أن كل ورقة تحتوي على نوع من الحيوانات من بين مجموعة من الأنواع المحتملة.

وبالمثل، يمكن لأشجار القرارات التنبؤ بالقيم الرقمية من خلال تصنيف الأوراق بالتنبؤات الانحدارية (القيم الرقمية). على سبيل المثال، تتنبأ شجرة القرار التالية بدرجة الجاذبية العددية لحيوان ما بين 0 و10.

شجرة قرارات تتضمّن كل ورقة شجر رقم نقطة عائمة مختلفًا.

الشكل 3. شجرة قرارات ينتج عنها تنبؤ عددي.