למידה בפיקוח

המשימות של הלמידה בפיקוח מוגדרות היטב ואפשר ליישם אותן במגוון תרחישים, כמו זיהוי ספאם או חיזוי של משקעים.

מושגי יסוד בלמידה מונחית

למידת מכונה מבוקרת מבוססת על מושגי הליבה הבאים:

  • נתונים
  • מודל
  • הדרכה
  • הערכה
  • מסקנות

נתונים

נתונים הם הכוח המניע של למידת המכונה. הנתונים מופיעים כמילים ומספרים שמאוחסנים בטבלאות, או כערכים של פיקסלים וצורות גל שתועדו בקובצי תמונות ובקובצי אודיו. אנחנו מאחסנים נתונים קשורים במערכי נתונים. לדוגמה, יכול להיות שיש לנו את מערך הנתונים הבא:

  • תמונות של חתולים
  • מחירי דיור
  • מידע על מזג האוויר

מערכי הנתונים מורכבים מדוגמאות נפרדות שמכילות תכונות ותווית. אפשר לדמות את הדוגמה לשורה אחת בגיליון אלקטרוני. תכונות הן הערכים שבהם מודל בפיקוח משתמש כדי לחזות את התווית. התווית היא ה'תשובה', או הערך שאנחנו רוצים שהמודל יחז. במודל מזג אוויר שחזוי גשם, התכונות יכולות להיות קו רוחב, קו אורך, טמפרטורה, לחות, כיסוי הענן, כיוון הרוח והלחץ האטמוספרי. התווית תהיה כמות הגשם.

דוגמאות שמכילות גם תכונות וגם תווית נקראות דוגמאות עם תוויות.

שתי דוגמאות עם תוויות

תמונה למילוי מקום.

לעומת זאת, דוגמאות ללא תוויות מכילות תכונות, אבל לא תוויות. אחרי שיוצרים מודל, המודל יוצר תחזית לגבי התווית על סמך התכונות.

שתי דוגמאות ללא תוויות

תמונה למילוי מקום.

מאפיינים של מערך נתונים

מערך נתונים מאופיין בזכות הגודל והמגוון שלו. הגודל מציין את מספר הדוגמאות. השונות מציינת את הטווח שהדוגמאות האלה כוללות. מערכי נתונים טובים הם גם גדולים וגם מגוונים מאוד.

חלק ממערכי הנתונים הם גדולים ומגוונים. עם זאת, חלק ממערכי הנתונים גדולים אבל המגוון בהם נמוך, וחלקם קטנים אבל מגוונים מאוד. במילים אחרות, מערך נתונים גדול לא מבטיח גיוון מספיק, ומערך נתונים מגוון מאוד לא מבטיח מספיק דוגמאות.

לדוגמה, מערך נתונים יכול להכיל נתונים של 100 שנים, אבל רק עבור חודש יולי. השימוש במערך הנתונים הזה לחיזוי כמות הגשם בינואר יכול להניב תחזיות חלשות. לעומת זאת, מערך נתונים יכול להכיל רק כמה שנים, אבל להכיל את כל החודש. מערך הנתונים הזה עשוי להניב תחזיות גרועות כי הוא לא מכיל מספיק שנים כדי להביא בחשבון את השונות.

בחינת ההבנה

באילו מאפיינים של מערך נתונים כדאי להשתמש בלמידת מכונה?
גודל קטן / גיוון נמוך
גודל גדול / מגוון קטן
גודל קטן / גיוון גבוה
גודל גדול / גיוון גבוה

אפשר לאפיין מערך נתונים גם באמצעות מספר התכונות שלו. לדוגמה, מערכי נתונים מסוימים של מזג האוויר עשויים להכיל מאות תכונות, מצילומי לוויין ועד לערכים של כיסוי עננים. מערכי נתונים אחרים עשויים להכיל רק שלוש או ארבע תכונות כמו לחות, לחץ אטמוספרי וטמפרטורה. מערכי נתונים עם יותר תכונות יכולים לעזור למודל לגלות דפוסים נוספים וליצור חיזויים טובים יותר. עם זאת, מערכי נתונים עם יותר תכונות לא תמיד יוצרים מודלים שמספקים תחזיות טובות יותר, כי יכול להיות שלתכונות מסוימות אין קשר סיבתי לתווית.

מודל

בלמידה מונחית, מודל הוא אוסף מספרים מורכב שמגדירים את הקשר המתמטי בין דפוסים ספציפיים של תכונות קלט לבין ערכים ספציפיים של תוויות פלט. המודל מגלה את הדפוסים האלה באמצעות אימון.

הדרכה

כדי שמודל בפיקוח יוכל לבצע חיזויים, יש לאמן אותו. כדי לאמן מודל, אנחנו נותנים למודל מערך נתונים עם דוגמאות. מטרת המודל היא למצוא את הפתרון הטוב ביותר לחיזוי התוויות באמצעות התכונות. המודל מוצא את הפתרון הטוב ביותר באמצעות השוואה בין הערך החזוי שלו לערך בפועל של התווית. על סמך ההפרש בין הערך החזוי לערך בפועל, המוגדר כ-loss, המודל מעדכן את הפתרון שלו בהדרגה. במילים אחרות, המודל לומד את הקשר המתמטי בין התכונות לתווית כדי ליצור את התחזיות הטובות ביותר לגבי נתונים שלא נראים.

לדוגמה, אם לפי התחזיות של המודל צפוי לרדת גשם מסוג 1.15 inches, אבל הערך בפועל היה .75 inches, הפתרון ישתנה כך שהחיזוי שלו יהיה קרוב יותר לערך .75 inches. אחרי שהמודל בחן כל דוגמה במערך הנתונים, במקרים מסוימים, כמה פעמים, הוא מגיע לפתרון שמספק את החיזוי הטוב ביותר, בממוצע, לכל אחת מהדוגמאות.

האיור הבא מדגים אימון מודל:

  1. המודל לוקח דוגמה אחת עם תווית ומספק חיזוי.

    תמונה של מודל שמבצע חיזוי.

    איור 1. מודל למידת מכונה שמבצע חיזוי מדוגמה מתויגת.

     

  2. המודל משווה את הערך החזוי לערך בפועל ומעדכן את הפתרון שלו.

    תמונה של מודל שמשווה את החיזוי שלו לערך בפועל.

    איור 2. מודל למידת מכונה מעדכן את הערך החזוי שלו.

     

  3. המודל חוזר על התהליך הזה בכל דוגמה מתויגת במערך הנתונים.

    תמונה של מודל שחוזר על תהליך החיזוי שלו לעומת הערך בפועל.

    איור 3. מודל למידת מכונה מעדכן את החיזויים שלו לכל דוגמה מתויגת במערך הנתונים לאימון.

     

כך המודל לומד בהדרגה את הקשר הנכון בין התכונות לתווית. ההבנה ההדרגתית הזו היא גם הסיבה שמערכי נתונים גדולים ומגוונים יוצרים מודל טוב יותר. המודל קיבל יותר נתונים עם מגוון רחב יותר של ערכים, ושיפר את ההבנה של הקשר בין המאפיינים לבין התווית.

במהלך האימון, מומחי למידת מכונה יכולים לבצע שינויים קלים בהגדרות ובתכונות שהמודל משתמש בהן כדי ליצור תחזיות. לדוגמה, לתכונות מסוימות יש יכולת חיזוי גבוהה יותר מאחרות. לכן מומחי למידת מכונה יכולים לבחור את התכונות שישמשו את המודל במהלך האימון. לדוגמה, נניח שמערך נתונים של מזג האוויר מכיל time_of_day כתכונה. במקרה כזה, המומחה בלמידת מכונה יכול להוסיף או להסיר את time_of_day במהלך האימון, כדי לראות אם המודל יוצר חיזויים טובים יותר עם או בלי.

הערכה

אנחנו מעריכים מודל שעבר אימון כדי לקבוע באיזו מידה הוא למד. כשאנחנו מעריכים מודל, אנחנו משתמשים במערך נתונים מתויג, אבל נותנים למודל רק את התכונות שלו. עכשיו אנחנו משווים בין החיזויים של המודל לבין הערכים האמיתיים של התווית.

תמונה שמציגה מודל שעבר אימון משווה את החיזויים שלו לערכים בפועל.

איור 4. הערכת מודל למידת מכונה על ידי השוואת התחזיות שלו לערכים בפועל.

 

בהתאם לחיזויים של המודל, יכול להיות שנבצע יותר אימון והערכה לפני פריסת המודל באפליקציה בעולם האמיתי.

בחינת ההבנה

למה צריך לאמן מודל כדי שהוא יכול לבצע תחזיות?
צריך לאמן מודל כך שלא יזדקק לנתונים כדי לבצע חיזוי.
צריך לאמן מודל כדי ללמוד את הקשר המתמטי בין התכונות לתווית במערך נתונים.
לא צריך לאמן מודל. הדגמים זמינים ברוב המחשבים.

מסקנות

אחרי שמרוצים מהתוצאות של הערכת המודל, אנחנו יכולים להשתמש במודל כדי ליצור תחזיות, שנקראות הסקת מסקנות, על סמך דוגמאות ללא תוויות. בדוגמה של אפליקציית מזג האוויר, אפשר למודל את תנאי מזג האוויר הנוכחיים – כמו טמפרטורה, לחץ אטמוספרי והלחות היחסית, והוא יחזה את כמות הגשם.