ייצור מערכות למידת מכונה: סטטיות לעומת הסקה דינמית
הסקה היא תהליך יצירת תחזיות על ידי החלת מודל מאומן על דוגמאות לא מתויגות.
באופן כללי, מודל יכול להסיק תחזיות באחת משתי דרכים:
הסקה סטטית (שנקראת גם הסקה אופליין או הסקה באצווה) היא תהליך שבו המודל מבצע תחזיות על קבוצה של דוגמאות נפוצות ללא תוויות, ולאחר מכן מאחסן את התחזיות האלה במטמון במקום כלשהו.
הסקה דינמית (נקראת גם הסקה אונליין או הסקה בזמן אמת) פירושה שהמודל יוצר תחזיות רק על פי דרישה, למשל כשלקוח מבקש תחזית.
דוגמה קיצונית: נניח שיש מודל מורכב מאוד שנדרשת שעה כדי להסיק ממנו תחזית.
זהו כנראה מצב מצוין להסקה סטטית:
נניח שבאותו מודל מורכב נעשה שימוש בטעות בהסקה דינמית במקום בהסקה סטטית. אם הרבה לקוחות מבקשים תחזיות בערך באותו זמן, רובם לא יקבלו את התחזית הזו במשך שעות או ימים.
עכשיו נבחן מודל שמסיק במהירות, אולי תוך 2 אלפיות שנייה, באמצעות מינימום יחסי של משאבי מחשוב. במצב כזה, לקוחות יכולים לקבל תחזיות במהירות וביעילות באמצעות הסקת מסקנות דינמית, כפי שמתואר באיור 5.
הסקת מסקנות סטטית
להסקה סטטית יש יתרונות וחסרונות מסוימים.
יתרונות
אין צורך לדאוג יותר מדי לגבי עלות ההסקה.
אפשר לבצע אימות של התחזיות לפני השליחה.
חסרונות
אפשר להציג רק תחזיות שנשמרו במטמון, לכן יכול להיות שהמערכת לא תוכל להציג תחזיות לדוגמאות קלט נדירות.
זמן האחזור של העדכון צפוי להיות בשעות או בימים.
מסקנה דינמית
להסקה דינמית יש יתרונות וחסרונות מסוימים.
יתרונות
אפשר להסיק תחזית לגבי כל פריט חדש שמגיע, וזה מצוין לתחזיות של 'זנב ארוך' (פחות נפוצות).
חסרונות
משימות שמתבצעות בעיקר במחשוב וחשוב להן זמן אחזור קצר. השילוב הזה עשוי להגביל את המורכבות של המודל. כלומר, יכול להיות שתצטרכו ליצור מודל פשוט יותר שיכול להסיק תחזיות מהר יותר מאשר מודל מורכב.
יש צורך במעקב אינטנסיבי יותר.
תרגילים: בדיקת ההבנה
אילו שלוש מההצהרות הבאות נכונות לגבי היסק סטטי?
המודל צריך ליצור תחזיות לכל הקלטות האפשריות.
כן, המודל צריך לבצע חיזויים לכל הקלטות האפשריות ולשמור אותם במטמון או בטבלת חיפוש.
אם קבוצת הדברים שהמודל מנבא מוגבלת, ייתכן שהסקת מסקנות סטטית היא בחירה טובה.
עם זאת, כשמדובר בקלט בפורמט חופשי, כמו שאילתות של משתמשים עם זנב ארוך של פריטים חריגים או נדירים, היסק סטטי לא יכול לספק כיסוי מלא.
המערכת יכולה לאמת תחזיות משוערות לפני שהיא מציגה אותן.
כן, זהו היבט שימושי של הסקת נתונים סטטית.
למודל יש אפשרות לספק חיזוי מהר יותר ממסקנה דינמית, בהתאם לקלט נתון.
כן, כמעט תמיד אפשר להציג חיזויים מהר יותר באמצעות הסקת נתונים סטטית מאשר באמצעות הסקת נתונים דינמית.
תוכלו להגיב במהירות לשינויים בעולם.
לא, זהו חיסרון של הסקת מסקנות סטטית.
אילו מההצהרות הבאות נכונות לגבי היסק דינמי?
אפשר לספק חיזויים לכל הפריטים האפשריים.
כן, זוהי אחת מהיתרונות של הסקת מסקנות דינמית. כל בקשה שתתקבל תקבל ניקוד. באמצעות היסק דינמי אפשר לטפל בהתפלגויות של זנב ארוך (כאלה עם הרבה פריטים נדירים), כמו המרחב של כל המשפטים האפשריים שנכתבו בביקורות על סרטים.
אפשר לבצע אימות של התחזיות אחרי שהן נוצרות, לפני שמשתמשים בהן.
באופן כללי, אי אפשר לבצע אימות של כל התחזיות לאחר שהן נוצרות, לפני שמשתמשים בהן, כי התחזיות נוצרות על פי דרישה. עם זאת, אפשר לעקוב אחרי איכות התחזיות המצטברות כדי לספק רמה מסוימת של בדיקת איכות, אבל התחזיות האלה יפעילו אזעקות אש רק אחרי שהאש כבר תתפשט.
כשמבצעים הסקה דינמית, לא צריך לדאוג לגבי זמן האחזור של התחזיות (זמן ההשהיה עד להחזרת התחזיות) כמו כשמבצעים הסקה סטטית.
זמן האחזור של החיזוי הוא לרוב בעיה אמיתית בהסקה דינמית.
לצערנו, לא בטוח שאפשר לפתור בעיות של זמן אחזור של חיזוי על ידי הוספת עוד שרתי היסק.