נתונים קטגוריים: תרגולים שונים של תכונות

Playground הוא אפליקציה אינטראקטיבית שמאפשרת לבצע שינויים של אימון ובדיקה של מודל למידת מכונה. ב-Playground אפשר לבחור תכונות ולשנות היפר-פרמטרים, ולגלות איך הבחירות שלכם משפיעות על המודל.

הדף הזה מכיל שני תרגילים ב-Playground.

תרגיל 1: הצלבת תכונות בסיסיות

לצורך התרגיל הזה, צריך להתמקד בחלקים הבאים של מגרש המשחקים ממשק משתמש:

  • מתחת לתכונות, שימו לב לשלוש תכונות אפשריות של המודל:
    • x1
    • x2
    • x1x2
  • מתחת לפלט יופיע ריבוע שמכיל כתום והנקודות הכחולות. נניח שאתם מסתכלים על יער מרובע, שבו נקודות כתומות מציינות את המיקום של עצים חולים ונקודות כחולות מציינות של עצים בריאים.
  • בין FEATURES ל-OUTPUT, אם תסתכלו מקרוב, תראו קווים חלשים מקווקווים שמחברים כל מאפיין לפלט. הרוחב של כל קו מקווקו מסמל את המשקל שמשויך כרגע לגבי כל תכונה. השורות האלה חלשים מאוד מפני שמשקל ההתחלה עבור כל מאפיין, המערכת מאתחלת את הערך 0. ככל שהמשקל גדל או מתכווץ, יהיה העובי של השורות האלה.

משימה 1: מבצעים את הפעולות הבאות כדי לחקור את Playground:

  1. לוחצים על הקו החלש שמחבר את התכונה 1 לפלט. יופיע חלון קופץ.
  2. בחלון הקופץ, מזינים את המשקל 1.0.
  3. מקישים על Enter.

שימו לב לדברים הבאים:

  • הקו המקווקו של x1 נעשה עבה יותר ככל שהמשקל גדל מ-0 ל-1.0.
  • עכשיו יופיע רקע בצבע כתום וכחול.
    • הרקע הכתום הוא הניחושים של המודל בנוגע למיקום העצים החולים הן.
    • הרקע הכחול הוא הניחוש של המודל לגבי המיקום של העצים הבריאים הן. המודל עושה עבודה גרועה, כמחצית מהניחושים של המודל שגוי.
  • מכיוון שהמשקל הוא 1.0 עבור x1 ו-0 עבור שאר התכונות, המודל תואם בדיוק לערכי x1.

משימה 2: שנו את המשקולות של כל אחת משלושת הישויות האלה, כך (צבעי הרקע) יחזה בהצלחה עצים. הפתרון מופיע ממש מתחת ל-Playground.



תרגיל 2: שילוב של תכונות מתוחכמות יותר

בתרגיל השני, בדקו את סידור הנקודות הכתומות (עצים חולים) ונקודות כחולות (עצים בריאים) במודל הפלט, תוך התייחסות לדברים הבאים:

  • הנקודות יוצרות תבניות כדוריות פחות או יותר.
  • הסדר של הנקודות רועש. לדוגמה, שימו לב לכחול נקודות בכדור החיצוני של הנקודות הכתומות. לכן, גם מודל מצוין לא סביר לחזות נכון כל נקודה.

משימה 1: מבצעים את הפעולות הבאות כדי לחקור את ממשק המשתמש של Playground:

  1. ללחוץ על הלחצן 'הפעלה/השהיה', שהוא משולש לבן בתוך משולש שחור מעגל. Playground יתחיל באימון המודל. לשים לב מונה התקופות.
  2. לאחר שהמערכת עברה אימון במשך 300 תקופות של זמן (epoch) לפחות, לוחצים על לחצן הפעלה/השהיה כדי להשהות את האימון.
  3. תראו את המודל. האם המודל מספק תחזיות טובות? במילים אחרות, הן בדרך כלל הנקודות הכחולות שמוקפות ברקע כחול, נקודות כתומות בדרך כלל מוקפות ברקע כתום?
  4. בודקים את הערך של 'הפסד בדיקה', שמופיע ממש מתחת ל-OUTPUT. האם זה קרוב ל-1.0 (הפסד גבוה יותר) או קרוב ל-0 (אובדן נמוך יותר)?
  5. מאפסים את Playground על ידי לחיצה על החץ העקומה שמשמאל לחצן הפעלה/השהיה.

משימה 2: מבצעים את הפעולות הבאות כדי לבנות מודל טוב יותר:

  1. בוחרים או מבטלים את הבחירה בשילוב כלשהו של חמש התכונות האפשריות.
  2. מתאימים את קצב הלמידה.
  3. אימון המערכת למשך 500 תקופות של זמן לפחות.
  4. לבדוק את הערך של אובדן הבדיקות. האם יכול להיות שמספר המשתמשים שהפסדת בבדיקה נמוך מ-0.2?

הפתרונות מופיעים מתחת ל-Playground.