איסוף נתונים: בדיקת ההבנה שלך

כדי להשיב על השאלה הבאה, לוחצים על החץ הרצוי:

נניח שאתם עובדים על מודל של למידה חישובית הקשור לפרסום, ואתם רוצים לחזות את ההוצאות של המפרסמים בינואר. יש הגבלות על כמות הנתונים שאפשר לאחסן בדיסק, לכן עליך להשתמש רק בקבוצת משנה של נתונים זמינים. ניתן להשתמש בכל הנתונים העדכניים ביותר, מהחודש הקודם בדצמבר. מישהו אחר מציע דגימת נתונים במהלך השנה האחרונה. איזו שיטה יכולה להיות טובה יותר ולמה?
נתונים מהחודש הקודם (דצמבר)
אמנם הנתונים האלה עדכניים יותר, אבל הם עשויים להיות מושפעים מהשפעות עונתיות של ההוצאות של מפרסמים לפני החגים של דצמבר.
נתונים שנדגמו במהלך השנה
הנתונים האלה ישנים יותר, אבל יש סיכוי נמוך יותר שהם יושפעו מהשפעות עונתיות של הוצאות הפרסום לפני תקופת החגים של דצמבר.
אתם רוצים להציג סרטונים שהמשתמשים מעוניינים לצפות בהם. בחרת להשתמש בסרטונים שהם צפו בהם ב-YouTube כתווית. האם התווית היא ישירה או נגזרת?
נגזר
התווית הזו נגזרת מכך שהיא לא החיזוי המדויק שברצונך לבצע. יכול להיות שהמשתמש פתח את הסרטון, אבל סגר אותו זמן קצר לאחר מכן. המערכת תספור את האירוע הזה כצפייה, גם אם המשתמש לא צפה בסרטון. במקרים מסוימים, אמצעים היברידיים כמו זה עשויים להיות האפשרות היחידה שלך, אבל חשוב לדעת מהו סוג התווית (ישיר או נגזר) ואיך היא מגבילה את החיזויים.
ישיר
התווית הזו עשויה לגרום לחיזוי מדויק חלק גדול מהזמן, אבל היא לא החיזוי המדויק שברצונך לבצע.