בדיקת ההבנה שלכם: למידת מכונה (ML) בסביבת ייצור

לא ניתן להציג ב-Colab את ההנחיות לבדיקת צינור עיבוד נתונים. במקום זאת, התרגילים הבאים יעזרו לכם לתרגל את ההנחיות. בדף הבא מתוארים משאבים להטמעת ההנחיות.

לשאלות הבאות, לוחצים על האפשרות הרצויה כדי להרחיב ולבדוק את התשובה.

אחרי שמפעילים את חזוי חד-קרן, צריך לשמור על העדכניות של החיזוי על ידי אימון מחדש של נתונים חדשים. מכיוון שיש לך יותר מדי נתונים חדשים לאימון, אתה מחליט להגביל את נתוני האימון על ידי דגימת הנתונים החדשים לאורך חלון זמן מסוים. כמו כן, עליך להביא בחשבון דפוסי שימוש יומיים ושנתיים בחד-קרן. בנוסף, הדרך המהירה ביותר להשיק גרסאות חדשות של המודל היא מדי שלושה חודשים. מהו חלון הזמן הנבחר?
יום אחד, כי חלון גדול יותר יוביל לכמות גדולה של נתונים והמודל יימשך זמן רב מדי.
תשובה לא נכונה. אפשר לשנות את קצב דגימת הנתונים כדי להגביל את הגודל של מערך הנתונים. מאחר שניתן לעדכן את המודל רק מדי שלושה חודשים, מודל שלמד על ערך של יום יהפוך למיושן.
שבוע אחד, כך שמערך הנתונים לא גדול מדי, אבל עדיין אפשר להחליק דפוסים.
תשובה לא נכונה. אפשר לשנות את קצב דגימת הנתונים כדי להגביל את הגודל של מערך הנתונים. מאחר שניתן לעדכן את המודל רק מדי שלושה חודשים, מודל שנלמד על ערך נתונים של שבוע יהפוך למיושן.
שנה אחת כדי לוודא שהמודל לא מוטה בתבניות יומיות או שנתיות.
תשובה נכונה! יש לבחור מערך נתונים מייצג כדי שהמודל ילמד לחזות את כל התרחישים.
הפעלת את חזוי חד-קרן. זה פועל היטב! אתה יוצא לחופשה וחוזר אחרי שלושה שבועות כדי לראות שאיכות המודל שלך ירדה באופן משמעותי. צריך להניח שההתנהגות של חד-קרן לא תשתנה באופן משמעותי בעוד שלושה שבועות. מהו ההסבר הסביר ביותר לירידה באיכות?
צוות הכשרה.
נכון. סביר להניח שהתנהגות חד-הקרן לא השתנתה, אבל ייתכן שהדיווח הבסיסי על נתונים או פורמט הנתונים השתנו בנתוני ההצגה לאחר איסוף נתוני האימון. כדי לזהות הטיה אפשרית להצגת האימון, יש לבדוק את נתוני ההצגה מול סכימת הנתונים של האימון.
שכחת לבדוק את איכות המודל ביחס לסף קבוע.
תשובה לא נכונה. כדאי לבדוק את איכות המודל כדי לזהות ירידה באיכות, אבל לא להסביר מה הסיבה לירידה.
המודל שלך לא פעיל.
שגוי, בהנחה שנתוני האימון שלך מכסים את כל מחזורי ההתנהגות של חד-קרן, כפי שמתואר בשאלה הקודמת.
את/ה מחליט/ה בצורה חכמה לעקוב אחר החיזויים עבור אנטרקטיקה מפני שאין לך מספיק נתוני הדרכה. איכות החיזוי מסתנכרנת באופן מסתורי למשך כמה ימים, במיוחד בחורף. מה יכול להיות הסיבה לכך?
גורם סביבתי.
נכון. גילית שסופות באנטארקטיקה קשורות לירידה באיכות החיזוי. במהלך הסופות האלה, התנהגות חד-קרן משתנה. בנוסף, לא ניתן לאסוף נתונים במהלך סופות באנטארקטיקה, ולכן המודל לא יכול להתאמן לתנאים כאלה.
המודל שלך אינו פעיל.
תשובה לא נכונה. אם הסיבה הזו הייתה נכונה, האיכות תרד באופן רציף ככל שהמודל הפך למיושן, במקום לרדת רק לאחר כמה ימים.
אין צורך. למודלים של למידת מכונה יש רנדומיזציה מובנת.
תשובה לא נכונה. אם איכות המודל משתנה, עליך לבדוק את הסיבה לכך. כדי להימנע מאקראיות באימון המודל, אפשר לנסות לשפר את יכולת השחזור.
חיזוי חד-הקרן שלך פועל במשך שנה. תיקנת בעיות רבות והאיכות עכשיו גבוהה. עם זאת, הייתה בעיה קטנה אבל קבועה. איכות המודל שלך השתנתה מעט יותר באזורים העירוניים. למה יכול להיות?
האיכות הגבוהה של החיזויים עוזרת למשתמשים למצוא בקלות חד-קרן, וזה משפיע על התנהגות המראה של חד-קרן עצמו.
נכון. חד-קרן הגיב לתשומת לב רבה יותר על ידי שינוי ההתנהגות שלו באזורים העירוניים. כאשר התחזיות של המודל מותאמות להתנהגות המשתנה, חד-קרן ממשיך לשנות את התנהגותו. מצב כזה, שבו ההתנהגות של המודל משפיעה על נתוני האימון עצמם, נקרא לולאת משוב. מומלץ לנסות לשנות את זיהוי ההטיה של שירות האימון כדי לזהות שינויים בנתוני ההצגה, בהתאם לשינויים בהתנהגות חד-קרן.
חדי הקרן מדווחים מספר פעמים באזורים שמאוכלסים בצפיפות, ומטים את נתוני האימון.
תשובה לא נכונה. סביר להניח שזו לא הסיבה לכך, שבגלל ההטיה הזו הייתה ירידה באיכות האיכות לאחר ההשקה.
באזורים עירוניים קשה לבחור מודל.
תשובה לא נכונה. אם הייתה בעיה בחיזוי המודל באזורים עירוניים, האיכות תהיה נמוכה מההתחלה, במקום שהאיכות תיפגע למטה אחרי ההשקה.