למידת מכונה אוטומטית (AutoML)

אם אתם מתחילים פרויקט חדש של למידת מכונה (ML), יכול להיות שאתם תוהים אם אימון ידני הוא האפשרות היחידה ליצירת מודל למידת מכונה. באימון ידני, כותבים קוד באמצעות מסגרת של למידת מכונה כדי ליצור מודל. במהלך התהליך הזה, בוחרים את האלגוריתמים שרוצים לבדוק ומכווננים באופן איטרטיבי את הפרמטרים העל-היפר כדי למצוא את המודל המתאים.

כמובן, אימון המודל הוא לא הדבר היחיד שצריך להביא בחשבון. בפועל, בניית מודל למידת מכונה מהאב טיפוס ועד לייצור כוללת משימות חוזרות ומיומנויות ייעודיות. תהליך עבודה פשוט של ניתוח נתונים באמצעות למידת מכונה נראה בערך כך:

איור 1.  תהליך עבודה פשוט של למידת מכונה.
איור 1. תהליך עבודה פשוט לניתוח למידת מכונה.

משימות חוזרות – תהליך העבודה של למידת המכונה יכול לכלול עבודה חוזרת וניסויים. לדוגמה, במהלך פיתוח המודל בדרך כלל צריך לבדוק שילובים שונים של אלגוריתמים והיפר-פרמטרים כדי לזהות את המודל המתאים ביותר. בתהליך אימון ידני, כותבים קוד מיוחד לאימון המודל, ואז משנים את הקוד כדי להריץ ניסויים עם אלגוריתמים שונים של למידת מכונה ועם פרמטרים היפר-מרחביים שונים כדי למצוא את המודל הטוב ביותר. בפרויקטים קטנים או בפרויקטים של חקירה, התהליך הידני הזה לא מהווה בעיה, אבל בפרויקטים גדולים יותר, המשימות החוזרות על עצמן יכולות להיות זמן רב.

מיומנויות מיוחדות – פיתוח ידני של מודל למידת מכונה מחייב מיומנויות מיוחדות. בפועל, יכול להיות שלא לכל צוות שמתכנן לפתח מודל למידת מכונה יש את הכישורים האלה. אם לצוות אין מדען נתונים ייעודי, יכול להיות שאי אפשר יהיה לבצע את העבודה הזו באופן ידני.

למרבה המזל, יש שלבים מסוימים בפיתוח מודל שאפשר להפוך לאוטומטיים כדי להפחית את העומס של עבודה חוזרת ונשנית ואת הצורך במיומנויות מיוחדות. האוטומציה של המשימות האלה היא הנושא של המודול הזה בנושא למידת מכונה אוטומטית (AutoML).

מהו AutoML?

AutoML הוא תהליך של אוטומציה של משימות מסוימות בתהליך עבודה של למידת מכונה. אפשר להתייחס ל-AutoML כאל קבוצה של כלים וטכנולוגיות שמאפשרים ליצור מודלים של למידת מכונה מהר יותר ולגשת אליהם בקלות רבה יותר על ידי קבוצה רחבה יותר של משתמשים. אוטומציה יכולה לעזור בכל שלבי תהליך העבודה של למידת המכונה, אבל המשימות שמשויכות ל-AutoML הן בדרך כלל אלה שכלולות במחזור הפיתוח של המודל שמוצג באיור 1. משימות חוזרות ונשנות כוללות:

  • הנדסת נתונים
    • הנדסת פיצ'רים (feature engineering).
    • בחירת תכונות.
  • הדרכה
    • זיהוי אלגוריתם למידת מכונה מתאים.
    • בחירת הפרמטרים האופטימליים.
  • ניתוח
    • הערכת מדדים שנוצרו במהלך האימון על סמך מערכי נתונים לבדיקה ולתיקוף.

בעזרת AutoML תוכלו להתמקד בבעיה ובנתונים של למידת המכונה, במקום בבחירת המאפיינים, בכוונון ההיפר-פרמטרים ובבחירת האלגוריתם הנכון.