ייצור מערכות למידת מכונה: בחינת הידע

  1. בחרת להשתמש בלמידת מכונה כדי לבנות מודל סיווג שיכול לחזות את המראה של חדי-קרן. במערך הנתונים מפורטים 10,000 מראה של חד-קרן ו-10,000 דמויות של חד-קרן. מערך הנתונים מכיל את המיקום, השעה ביום, הגובה, הטמפרטורה, הלחות, כיסוי העצים, הנוכחות של קשת בענן ועוד כמה מאפיינים.

    אחרי השקת הכלי לחיזוי מראה חד-קרן, יהיה עליך לשמור על רעננות המודל באמצעות אימון מחדש על נתונים חדשים. מכיוון שאתם אוספים יותר מדי נתונים חדשים לאימון, אתם מחליטים להגביל את נתוני האימון על ידי דגימת הנתונים החדשים בפרק זמן מסוים. כמו כן, עליך להביא בחשבון את הדפוסים היומיים והשנתיים במראה של חדי-קרן. איזה חלון זמן מתאים לך?

  2. הפעלת חיזוי המראה של חדי הקרן. זה עובד היטב! אתם יוצאים לחופשה וחוזרים אחרי שלושה שבועות ומגלים שאיכות המודל ירדה באופן משמעותי. נניח שלא סביר שההתנהגות של חד-קרן תשתנה באופן משמעותי תוך שלושה שבועות. מהו ההסבר הסביר ביותר לירידה באיכות?

  3. אתם בוחנים את החיזויים של המודל לגבי אנטארקטיקה, ומגלים שהמודל ביצע שם חיזויים לא טובים מאז שהמודל הופץ לייצור. איזה מהגורמים הבאים עשוי להיות המקור לבעיה?

  4. חיזוי המראה של חד-קרן פועל במשך שנה. תיקנת הרבה בעיות ועכשיו האיכות גבוהה. עם זאת, מזהים בעיה קטנה אבל קבועה. איכות המודל שלך ירדה קצת באזורים עירוניים. מה יכולה להיות הסיבה לכך?

  5. במהלך כל פתרון הבעיות, שיפרתם משמעותית את איכות החיזויים של מודל חד-הקרן, וכתוצאה מכך השימוש גדל פי עשרה. עם זאת, כעת משתמשים מתלוננים שהמודל איטי מאוד; בדרך כלל נדרשות יותר מ-30 שניות כדי להחזיר חיזויים. איזה מהשינויים הבאים יכול לעזור לפתור את הבעיה הזו?