למידה בפיקוח

המשימות של הלמידה המבוקרת מוגדרות היטב ואפשר להחיל אותן על מגוון תרחישים, כמו זיהוי ספאם או חיזוי משקעים.

מושגים בסיסיים של למידה מונחית

למידת מכונה מבוקרת מבוססת על המושגים הבסיסיים הבאים:

  • נתונים
  • מודל
  • הדרכה
  • הערכה
  • מסקנות

נתונים

נתונים הם הכוח המניע את למידת המכונה. הנתונים מופיעים כמילים ומספרים ששמורים בטבלאות, או כערכים של פיקסלים וגלים שמצולמים בתמונות ובקובצי אודיו. אנחנו מאחסנים נתונים קשורים במערכי נתונים. לדוגמה, יכול להיות שיש לנו מערך נתונים כזה:

  • תמונות של חתולים
  • מחירי דיור
  • מידע על מזג האוויר

מערכי הנתונים מורכבים מדוגמאות נפרדות שמכילות תכונות ותווית. אפשר לדמיין דוגמה לשורה אחת בגיליון אלקטרוני. תכונות הן הערכים שעליהם מודל בפיקוח משתמש כדי לחזות את התווית. התווית היא ה'תשובה', או הערך שאנחנו רוצים שהמודל יחזה. במודל מזג אוויר שחזוי משקעים, המאפיינים יכולים להיות קו רוחב, קו אורך, טמפרטורה, לחות, כיסוי הענן, כיוון הרוח והלחץ האטמוספרי. התווית היא כמות הגשם.

דוגמאות שכוללות גם תכונות וגם תווית נקראות דוגמאות עם תוויות.

שתי דוגמאות עם תוויות

תמונה למילוי מקום.

לעומת זאת, דוגמאות ללא תוויות מכילות תכונות, אבל לא תוויות. אחרי שיוצרים מודל, המערכת יוצרת תחזית לגבי התווית על סמך התכונות.

שתי דוגמאות ללא תוויות

תמונה למילוי מקום.

מאפיינים של מערך נתונים

מערך נתונים מאופיין בגודל ובמגוון שלו. הגודל מציין את מספר הדוגמאות. הגיוון יציין את הטווח שהדוגמאות האלה מתייחסות. מערכי נתונים טובים הם גם גדולים וגם מגוונים מאוד.

חלק ממערכי הנתונים הם גדולים ומגוונים. עם זאת, חלק ממערכי הנתונים הם גדולים אבל המגוון שלהם נמוך, וחלקם קטנים אבל מגוונים מאוד. כלומר, מערך נתונים גדול לא מבטיח מגוון מספיק, ומערך נתונים מגוון מאוד לא מבטיח מספיק דוגמאות.

לדוגמה, מערך נתונים עשוי להכיל נתונים של 100 שנים, אבל רק עבור החודש יולי. אם תשתמשו במערך הנתונים הזה לחיזוי כמות הגשם בינואר, תוכלו לחזות באיכות נמוכה יותר. לעומת זאת, מערך נתונים עשוי להכיל רק שנים ספורות, אבל להכיל כל חודש. מערך הנתונים הזה עשוי להפיק תחזיות גרועות כי הוא לא מכיל מספיק שנים כדי להביא בחשבון את השונות.

בחינת ההבנה

באילו מאפיינים של מערך נתונים כדאי להשתמש בלמידת מכונה?
גודל גדול / מגוון רחב
כדי שמערכת למידת המכונה תוכל להבין את הדפוסים הבסיסיים של הנתונים, חיוני להשתמש במספר גדול של דוגמאות שמכסה מגוון תרחישים לדוגמה. יש יותר סיכוי שמודל שעבר אימון על מערך נתונים מהסוג הזה יניב חיזויים טובים על נתונים חדשים.
גודל גדול / מגוון קטן
הביצועים של מודלים של למידת מכונה טובים רק כמו הדוגמאות שמשמשות לאימון. המודל יפיק חיזויים חלשים יותר על נתונים חדשים שהוא אף פעם לא אומן.
גודל קטן / מגוון גדול
ברוב המודלים המערכת לא מצליחה למצוא דפוסים מהימנים במערך נתונים קטן. בתחזיות, האמינות של מערך נתונים גדול יותר לא תהיה חזקה.
גודל קטן / מגוון קטן
אם מערך הנתונים קטן ואין בו הרבה הבדלים, יכול להיות שלא תוכלו להפיק תועלת מלמידת מכונה.

מערך נתונים יכול להיות מאופיין גם במספר התכונות שלו. לדוגמה, מערכי נתונים מסוימים של מזג האוויר עשויים להכיל מאות תכונות, החל מתמונות לוויין ועד לערכי כיסוי העננים. מערכי נתונים אחרים עשויים להכיל רק שלוש או ארבע תכונות, כמו לחות, לחץ אטמוספרי וטמפרטורה. מערכי נתונים עם יותר תכונות יכולים לעזור למודל לגלות דפוסים נוספים וליצור חיזויים טובים יותר. עם זאת, במערכי נתונים עם יותר תכונות לא תמיד נוצרים מודלים שמספקים חיזויים טובים יותר, כי יכול להיות שלחלק מהתכונות אין קשר סיבתי לתווית.

מודל

בלמידה מונחית, מודל הוא אוסף של מספרים מורכבים שמגדירים את הקשר המתמטי בין דפוסים ספציפיים של תכונות קלט לבין ערכים ספציפיים של תוויות פלט. המודל מגלה את הדפוסים האלה באמצעות אימון.

הדרכה

כדי שמודל בפיקוח יוכל לבצע חיזויים, יש לאמן אותו. כדי לאמן מודל, אנחנו נותנים למודל מערך נתונים עם דוגמאות. מטרת המודל היא למצוא את הפתרון הטוב ביותר לחיזוי התוויות לפי התכונות. המודל מוצא את הפתרון הטוב ביותר באמצעות השוואה בין הערך החזוי של הערך בפועל של התווית. על סמך ההפרש בין הערך החזוי לערך בפועל, המוגדר כהפסד, המודל מעדכן בהדרגה את הפתרון שלו. כלומר, המודל לומד את הקשר המתמטי בין התכונות והתווית, כדי שיוכל לבצע את התחזיות הטובות ביותר לגבי נתונים שלא נראים.

לדוגמה, אם לפי המודל היה אמור לרדת 1.15 inches, אבל הערך בפועל היה .75 inches, הפתרון משנה את הפתרון כך שהחיזוי שלו יהיה קרוב יותר ל-.75 inches. אחרי שהמודל בדק כל דוגמה במערך הנתונים – במקרים מסוימים, כמה פעמים – הוא מגיע לפתרון שמספק את החיזויים הטובים ביותר, בממוצע, לכל אחת מהדוגמאות.

באיור הבא מוצג אימון של מודל:

  1. המודל לוקח דוגמה אחת מתויגת ומספק חיזוי.

    תמונה של מודל שמבצע חיזוי.

    איור 1. מודל למידת מכונה (ML) שמבצע חיזוי מדוגמה מתויגת.

     

  2. המודל משווה את הערך החזוי שלו לערך בפועל ומעדכן את הפתרון שלו.

    תמונה של מודל שמשווה את החיזוי שלו לערך בפועל.

    איור 2. מודל למידת מכונה שמעדכן את הערך החזוי שלו.

     

  3. המודל חוזר על התהליך הזה בכל דוגמה מתויגת במערך הנתונים.

    תמונה של מודל שחוזרת על תהליך החיזוי שלו לעומת הערך בפועל.

    איור 3. מודל למידת מכונה שמעדכן את התחזיות שלו לכל דוגמה מתויגת במערך הנתונים לאימון.

     

כך המודל לומד בהדרגה את הקשר הנכון בין התכונות לבין התווית. ההבנה ההדרגתית הזו היא גם הסיבה לכך שמערכי נתונים גדולים ומגוונים יוצרים מודל טוב יותר. המודל קיבל יותר נתונים עם טווח ערכים רחב יותר, ושיפר את ההבנה של הקשר בין המאפיינים לבין התווית.

במהלך האימון, אנשי למידת מכונה יכולים לבצע שינויים קלים בהגדרות ובתכונות שהמודל משתמש בהן כדי לחזות. לדוגמה, לתכונות מסוימות יש יכולת חיזוי גבוהה יותר מאחרות. לכן אנשי מקצוע בתחום למידת מכונה יכולים לבחור את התכונות שישמשו את המודל במהלך האימון. לדוגמה, נניח שמערך נתונים של מזג אוויר מכיל time_of_day כתכונה. במקרה כזה, מומחים בלמידת מכונה יכולים להוסיף או להסיר את time_of_day במהלך האימון, כדי לראות אם המודל יוצר חיזויים טובים יותר – עם או בלי.

הערכה

אנחנו מעריכים מודל מאומן כדי לקבוע עד כמה הוא למד. כשאנחנו מעריכים מודל, אנחנו משתמשים במערך נתונים מתויג, אבל אנחנו נותנים למודל רק את התכונות של מערך הנתונים. אחרי כן אנחנו משווים בין החיזויים של המודל לבין הערכים האמיתיים של התווית.

תמונה שבה מוצגים החיזויים של מודל מאומן לעומת ערכים בפועל.

איור 4. הערכת מודל למידת מכונה על ידי השוואת התחזיות שלו לערכים בפועל.

 

בהתאם לתחזיות של המודל, יכול להיות שנבצע יותר אימון והערכה לפני פריסת המודל באפליקציה בעולם האמיתי.

בחינת ההבנה

למה צריך לאמן מודל כדי שהוא יוכל לחזות?
צריך לאמן מודל ללמוד את הקשר המתמטי בין התכונות לבין התווית במערך נתונים.
אין צורך לאמן מודל. המודלים זמינים ברוב המחשבים.
צריך לאמן מודל כדי שלא יזדקק לנתונים כדי לבצע חיזוי.

מסקנות

כשמרוצים מהתוצאות של הערכת המודל, אפשר להשתמש במודל כדי ליצור חיזויים (השערות) על דוגמאות ללא תוויות. בדוגמה של אפליקציית מזג האוויר, אפשר לתת למודל את תנאי מזג האוויר הנוכחיים – כמו טמפרטורה, לחץ אטמוספרי ולחות יחסית, והוא יחזה את כמות הגשם.