אם אתם מתחילים פרויקט חדש של למידת מכונה (ML), יכול להיות שאתם תוהים אם אימון ידני הוא האפשרות היחידה שלכם לפיתוח מודל למידת מכונה. ב- באימון ידני, כותבים קוד באמצעות framework של למידת מכונה כדי ליצור מודל. במהלך התהליך הזה, בוחרים את האלגוריתמים שרוצים לבדוק ומכווננים באופן איטרטיבי את הפרמטרים העל-היפר כדי למצוא את המודל המתאים.
כמובן, אימון המודל הוא לא הדבר היחיד שצריך להביא בחשבון. לחשבון להתאמן, לפתח מודל למידת מכונה מאב-טיפוס ועד לייצור כוללת משימות שחוזרות על עצמן ומיומנויות ספציפיות. תהליך עבודה פשוט של למידת מכונה לצורכי חקירה נראה בערך כך:
משימות שחוזרות על עצמן – תהליך העבודה של למידת מכונה יכול לכלול מטלות שחוזרות על עצמן לבצע במהירות ניסויים שונים. לדוגמה, במהלך פיתוח המודל צריך בדרך כלל לחקור שילובים שונים של אלגוריתמים והיפר-פרמטרים כדי לזהות המתאים ביותר. באימון ידני, כותבים קוד מיוחד לאמן את המודל ואז לשנות את הקוד כדי להריץ ניסויים בלמידת מכונה ובהיפר-פרמטרים, כדי למצוא את המודל הטוב ביותר. בפרויקטים קטנים או בפרויקטים של חקירה, התהליך הידני הזה לא מהווה בעיה, אבל בפרויקטים גדולים יותר, המשימות החוזרות האלה יכולות להיות זמן רב.
מיומנויות מיוחדות – פיתוח ידני של מודל למידת מכונה מחייב מיומנויות מיוחדות. בפועל, יכול להיות שלא לכל צוות שמתכנן לפתח מודל למידת מכונה יש את הכישורים האלה. אם לצוות אין מדען נתונים ייעודי, יכול להיות שאי אפשר יהיה לבצע את העבודה הזו באופן ידני.
למרבה המזל, אפשר לבצע באופן אוטומטי שלבים מסוימים בפיתוח המודל כדי לצמצם העומס של עבודה שחוזרת על עצמה והצורך במיומנויות מומחיות. האפשרות הזו תפעל באופן אוטומטי הוא הנושא של יחידת הלימוד הזו בנושא למידת מכונה אוטומטית (AutoML).
מה זה AutoML?
AutoML הוא תהליך של אוטומציה של משימות מסוימות בתהליך העבודה של למידת המכונה. אפשר להתייחס ל-AutoML כאל קבוצה של כלים וטכנולוגיות שמאפשרים ליצור מודלים של למידת מכונה מהר יותר ולגשת אליהם בקלות רבה יותר על ידי קבוצה רחבה יותר של משתמשים. אוטומציה יכולה לעזור בכל שלבי תהליך העבודה של למידת המכונה, אבל המשימות שמשויכות ל-AutoML הן בדרך כלל אלה שכלולות במחזור הפיתוח של המודל שמוצג באיור 1. אלה המשימות שחוזרות על עצמן:
- הנדסת מערכות מידע
- הנדסת פיצ'רים (feature engineering).
- בחירת תכונה.
- הדרכה
- זיהוי אלגוריתם למידת מכונה מתאים.
- בחירת ההיפר-פרמטרים הטובים ביותר.
- ניתוח
- להעריך מדדים שנוצרו במהלך האימון על סמך בדיקה ומערכי נתונים לאימות.
בעזרת AutoML תוכלו להתמקד בבעיה ובנתונים של למידת המכונה, במקום בבחירת המאפיינים, בכוונון ההיפר-פרמטרים ובבחירת האלגוריתם המתאים.