יישום המודל

כשמטמיעים מודל, מתחילים מדרך פשוטה. רוב העבודה בלמידת מכונה היא על נתונים ולכן קשה להפעיל צינור עיבוד נתונים מלא עבור מודל מורכב על המודל עצמו. אחרי הגדרת צינור הנתונים מודל פשוט שכולל כמה תכונות מאפשר לבצע איטרציה ביצירת מודל טוב יותר.

מודלים פשוטים מספקים בסיס טוב, גם אם לא תפעילו אותם בסופו של דבר. למעשה, מומלץ להשתמש במודל פשוט יותר ממה שאתם חושבים. להתחיל פשוט עוזר לך לקבוע אם מודל מורכב מוצדק או לא.

אימון מודל משלך לעומת שימוש במודל שכבר אומן

מודלים שעברו הכשרה מתאימים למגוון שימושים, היתרונות. אבל מודלים מאומנים באמת פועלים רק כשהתווית תואמות בדיוק למערך הנתונים שלכם. לדוגמה, אם המודל שעבר אימון משתמשת ב-25 תכונות, ומערך הנתונים כולל רק 24 מהן, הכי סביר להניח שהמודל יפיק חיזויים גרועים.

בדרך כלל, מתאמנים של למידת מכונה משתמשים בקטעי משנה תואמים של קלט שעבר אימון על כוונון עדין או העברה של למידת מכונה. אם המודל שעבר אימון פשוט לא קיים בתרחיש הספציפי שלכם, או להשתמש בקטעי משנה ממודל מאומן בזמן האימון של המודל.

לקבלת מידע נוסף על מודלים מאומנים, ראו:

מעקב

במהלך פריימינג, כדאי לשקול את תשתית המעקב וההתראות לצרכים לפתרון למידת מכונה.

פריסת המודל

במקרים מסוימים, מודל שעבר אימון חדש עשוי להיות גרוע יותר מהמודל הנוכחי בסביבת הייצור. אם כן, מומלץ למנוע את הפצתו אל בסביבת הייצור ולקבל התראה על כך שהפריסה האוטומטית נכשלה.

סטיות training-serving skew

אם לאחת מהתכונות הנכנסות שמשמשות לצורך הסקת יש ערכים שנמצאים מחוץ טווח ההתפלגות של הנתונים שמשמשים לאימון, צריך לקבל התראה כי סביר להניח שהמודל יפיק חיזויים גרועים. לדוגמה, אם את המודל אומן לחזות טמפרטורות בערים עם קו המשווה בגובה פני הים, מערכת הצגת המודעות אמורה להתריע בפניכם על נתונים נכנסים עם קווי רוחב קווי האורך ו/או הגבהים מחוץ לטווח שעליו אומן המודל. לעומת זאת, מערכת הצגת המודעות אמורה להתריע אם המודל שנמצאות מחוץ לטווח ההתפלגות שנצפה במהלך באימון.

שרת הסקת מסקנות

אם אתם מספקים מסקנות דרך מערכת RPC, כדאי לעקוב אחר שרת ה-RPC עצמו ומקבלים התראה אם הוא מפסיק לספק מסקנות.