סוגים של תנאים

היחידה הזו מתמקדת בסוגים שונים של תנאים שמשמשים לקבלת החלטות עצים.

תנאים ליישור ציר לעומת תנאים מוטים

תנאי היישור לציר כולל רק תכונה אחת. אלכסון התנאי כולל כמה תכונות. לדוגמה, הדוגמה הבאה היא תנאי יישור לציר:

num_legs ≥ 2

אף על פי שהתנאי הבא הוא לא אלים:

num_legs ≥ num_fingers

לעיתים קרובות, עצי ההחלטה מאומנים בעזרת תנאים שמותאמים לציר. אבל, לפעמים פיצולים אלכסוניים חזקים יותר, כי הם יכולים לבטא אותם מורכבים יותר דפוסים. לפעמים פיצולי Oblique מניבים תוצאות טובות יותר על חשבוננו עלויות גבוהות יותר של אימון והסקת מסקנות.

קוד YDF
ב-YDF, עצי ההחלטות מאומנים כברירת מחדל לפי תנאי יישור לציר. אפשר להפעיל עצים אלכסוניים של ההחלטה באמצעות הפרמטר split_axis="SPARSE_OBLIQUE".

התנאי המיושר לציר הוא 'num_legs >= 3'. תנאי האלכסוני הוא
  " num_legs + משקל * 5 >= 12".

איור 4. דוגמאות למצב יישור לציר ותנאי אלכסוני.

 

הצגת שני התנאים הקודמים בגרף מפיקה את שטח התכונה הבא הפרדה:

גרף של משקל לעומת num_legs. התנאי יישור לציר לא
  מתעלם ממשקל ולכן הוא פשוט קו אנכי. האליפסה
  מציג קו עם שיפוע שלילי.

איור 5. הפרדת שטח של תכונות עבור התנאים באיור 4.

 

תנאים בינאריים לעומת תנאים לא בינאריים

תנאים שיש להם שתי תוצאות אפשריות (למשל true או false) נקראים תנאים בינאריים. עצי החלטות שמכילים רק תנאים בינאריים שנקראים עצי החלטות בינאריים.

לתנאים לא בינאריים יש יותר משתי תוצאות אפשריות. לכן, לתנאים א-בינאריים יש יותר כוח דיסקרימינטיבי מתנאים בינאריים. החלטות שמכילות תנאי לא בינארי אחד או יותר נקראות החלטה לא בינארית עצים.

השוואה בין עצי החלטות בינאריים לעומת עצי החלטות לא בינאריים. ההחלטה הבינארית
  העץ מכיל שני תנאים בינאריים: עץ ההחלטות הא-בינארי
  מכיל תנאי לא בינארי אחד.

איור 6: עצי החלטות בינאריים לעומת עצי החלטות לא בינאריים.

 

תנאים עם יותר מדי יש סיכוי גבוה יותר שהחשמל יתאים. לכן, 'יערות החלטה' בדרך כלל משתמשים בעצי החלטות בינאריים, ולכן הקורס הזה יתמקד בהם.

הסוג הנפוץ ביותר של התנאי הוא תנאי הסף שמבוטא באופן הבא:

featurethreshold

לדוגמה:

num_legs ≥ 2

קיימים סוגים אחרים של תנאים. בהמשך מפורטים עוד סוגים נפוצים של תנאים בינאריים:

 

טבלה 2. סוגים נפוצים של תנאים בינאריים.

שם מצב דוגמה
תנאי סף $\mathrm{feature}_i \geq \mathrm{threshold}$ $\mathrm{num\_legs} \geq 2$
תנאי שוויון $\mathrm{feature}_i = \mathrm{value}$ $\mathrm{species} = ``cat"$
תנאי מוגדר $\mathrm{feature}_i \in \mathrm{collection}$ $\mathrm{species} \in \{``cat", ``dog", ``bird"\}$
מצב משופע $\sum_{i} \mathrm{weight}_i \mathrm{feature}_i \geq \mathrm{threshold}$ $5 \ \mathrm{num\_legs} + 2 \ \mathrm{num\_eyes} \geq 10$
תכונה חסרה $\mathrm{feature}_i \mathrm{is} \mathrm{ missing}$ $\mathrm{num\_legs} \mathrm{is} \mathrm{ missing}$