ייצור מערכות למידת מכונה: סטטיות לעומת הסקה דינמית

הסקה היא התהליך של ביצוע תחזיות על ידי החלת מודל מאומן דוגמאות ללא תווית. באופן כללי, מודל יכול להסיק תחזיות באחת משתי דרכים:

  • הֶקֵּשׁ סטטי (נקרא גם הֶקֵּשׁ אופליין או הֶקֵּשׁ באצווה) פירושו שהמודל מבצע תחזיות על דוגמאות לא מסומנות נפוצות ואז שומר את החיזויים האלה במטמון במקום כלשהו.
  • הֶקֵּשׁ דינמי (נקרא גם הֶקֵּשׁ אונליין או בזמן אמת פירושו שהמודל יוצר תחזיות רק על פי דרישה, לדוגמה, כשלקוח מבקש חיזוי.

דוגמה קיצונית: דמיינו מודל מורכב מאוד נדרשת שעה אחת כדי להסיק חיזוי. זה יהיה כנראה מצב מצוין להסקה סטטית:

איור 4.  בהסקה סטטית, מודל יוצר חיזויים,
            שלאחר מכן נשמרים במטמון בשרת.
איור 4. בהסקה סטטית, מודל יוצר חיזויים, שלאחר מכן נשמרים במטמון בשרת.

 

נניח שאותו מודל מורכב משתמש בטעות בהסקה דינמית במקום של ההֶקֵּשׁ הסטטי. אם לקוחות רבים מבקשים חיזויים באותו זמן, רובם לא יקבלו את החיזוי הזה במשך שעות או ימים.

עכשיו נבחן מודל שמסיק מסקנות במהירות, תוך 2 אלפיות שנייה באמצעות המינימום היחסי של משאבי חישוב. במצב כזה, הלקוחות יכולים לקבל תחזיות במהירות וביעילות באמצעות הסקת מסקנות דינמית, שמוצעים באיור 5.

איור 5.  בהסקה דינמית, המודל מסיק תחזיות על
            ביקוש.
איור 5. בהסקה דינמית, המודל מסיק תחזיות על פי דרישה.

 

הסקה סטטית

ההסקה הסטטית מציעה יתרונות וחסרונות מסוימים.

היתרונות

  • אין צורך לדאוג לגבי עלות ההסקה.
  • אפשרות לבצע אימות של חיזויים לפני שדוחפים אותם.

החסרונות

  • ניתן להציג רק חיזויים שנשמרו במטמון, ולכן ייתכן שהמערכת לא נוכל להציג חיזויים עבור דוגמאות קלט לא נפוצות.
  • זמן האחזור של תהליך העדכון נמדד ככל הנראה שעות או ימים.

הסקת מסקנות דינמית

הסקת מסקנות דינמית מציעה יתרונות וחסרונות מסוימים.

היתרונות

  • יכול להסיק חיזוי לגבי כל פריט חדש ברגע שהוא מגיע, היא מעולה לחיזויים מסוג "זנב ארוך" (פחות נפוץ).

החסרונות

  • מחשוב עתיר אנרגיה וזמן אחזור. השילוב הזה עשוי להגביל את המודל סיבוכיות; כלומר, ייתכן שתצטרכו ליצור מודל פשוט יותר להסיק תחזיות מהר יותר מכפי שמודל מורכב יכול.
  • המעקב אחרי צורכי המעקב אינטנסיבי יותר.

תרגילים: בדקו את ההבנה שלכם

מהן שלוש ההצהרות הבאות נכונות של ההֶקֵּשׁ הסטטי?
המודל חייב ליצור חיזויים לכל ערכי הקלט האפשריים.
כן, המודל חייב ליצור חיזויים לכל הקלט האפשרי לשמור אותם במטמון או בטבלת חיפוש. אם קבוצת הדברים שהמודל חוזה מוגבלת, יכול להיות שההֶקֵּשׁ הסטטי. עם זאת, כשמדובר בקלט חופשי כמו שאילתות של משתמשים, פריטים חריגים או נדירים, מסקנות סטטיות הסיקור המלא.
המערכת יכולה לאמת חיזויים שהוסקו לפני הצגת המודעה אותם.
כן, זהו היבט שימושי של ההסקה הסטטית.
לגבי קלט נתון, המודל יכול להציג חיזוי מהר יותר מהסקה דינמית.
כן, בעזרת ההסקה הסטטית כמעט תמיד אפשר להציג תחזיות מהר יותר יותר מהסקה דינמית.
אתם יכולים להגיב במהירות לשינויים בעולם.
לא, זהו חיסרון של ההסקה הסטטית.
איזה אחת מההצהרות הבאות היא נכון לגבי ההֶקֵּשׁ הדינמי?
אתם יכולים לספק חיזויים לכל הפריטים האפשריים.
כן, זו עוצמה של הסקת מסקנות דינמית. כל בקשה נכנס יקבל ניקוד. ההסקה הדינמית מטפלת ב'זנב ארוך' והתפלגויות (כאלה שיש בהן הרבה פריטים נדירים), כמו המרחב שכתובים בביקורות על סרטים.
ניתן לבצע אימות של חיזויים לפני שהם בשימוש.
באופן כללי, לא ניתן לבצע אימות של כל הפריטים חיזויים לפני שמשתמשים בהם, כי החיזויים לפי דרישה. עם זאת, אתם יכולים לעקוב מצטברות של תכונות חיזוי כדי לספק רמה מסוימת של בדיקת איכות, אך הם יאותתו התראות אש רק לאחר האש כבר התפשטה.
כשמבצעים הסקת מסקנות דינמית, לא צריך לדאוג מידע על זמן האחזור לחיזוי (זמן פרק הזמן לחזרה לחיזוי) בדיוק כמו שמבצעים הסקת מסקנות סטטיות.
זמן האחזור של החיזוי הוא לעיתים קרובות בעייתי ממשית בהסקה דינמית. לצערנו, לא ניתן בהכרח לתקן בעיות של זמן אחזור בחיזוי על ידי הוספה של עוד שרתי הסקת מסקנות.