לאחר יצירת המועמדים, מודל אחר נותן ציון ומדרג את המודל מועמדים לבחירת קבוצת הפריטים להצגה. מערכת ההמלצות יכולים להיות לכם כמה מחוללי מועמדים שמשתמשים במקורות שונים, כמו:
- פריטים קשורים ממודל פירוק לגורמים של מטריצה.
- תכונות משתמש בחשבון לצורך התאמה אישית.
- "מקומי" לעומת 'distant' items; כלומר, שימוש במידע גיאוגרפי בחשבון.
- פריטים פופולריים או פופולריים.
- תרשים של רשתות חברתיות; כלומר, פריטים שסומנו בלייק או שהומלצו על ידי חברים.
המערכת משלבת את המקורות השונים האלה למאגר משותף של מועמדים שקיבלו ניקוד לפי מודל יחיד ומדורגים לפי את התוצאה. לדוגמה, המערכת יכולה לאמן מודל לחזות להסתברות שמשתמש יצפה בסרטון ב-YouTube בהינתן הערך הבא:
- תכונות של שאילתות (לדוגמה: היסטוריית הצפייה של המשתמש, שפה, מדינה, זמן)
- תכונות של סרטונים (לדוגמה: שם, תגים, הטמעת סרטונים)
לאחר מכן המערכת יכולה לדרג את הסרטונים במאגר המועמדים לפי לחיזוי של המודל.
למה לא לתת למחולל המועמדים ציון?
מכיוון שמחוללים של מועמדים מחשבים ניקוד (כגון מדד הדמיון בתחום ההטמעה), יכול להיות שתתפתו להשתמש בהן כדי לדרג נו. עם זאת, יש להימנע מהשיטה הזו מהסיבות הבאות:
- חלק מהמערכות מסתמכות על מספר מחוללי מועמדים. הציונים האלה יכול להיות שלא ניתן להשוות בין גנרטורים שונים.
- עם מאגר קטן יותר של מועמדים, המערכת יכולה להרשות לעצמה להשתמש יותר תכונות ומודל מורכב יותר שיכול לתעד את ההקשר בצורה טובה יותר.
בחירת פונקציית יעד למתן ניקוד
כמו שאולי זכור לך מבעיית המבוא ללמידת מכונה (ML) פריים, למידת מכונה יכולה לפעול כמו ג'יני שובב: שמחה מאוד ללמוד את המטרה לתת, אבל צריך להפעיל שיקול דעת לגבי מה שרוצים. השובב הזה איכות מסוימת חלה גם על מערכות של המלצות. בחירת הניקוד יכולה להשפיע באופן משמעותי על הדירוג של פריטים, ובסופו של דבר איכות ההמלצות.
דוגמה:
לחצו על סמלי הפלוס כדי לגלות מה קורה כתוצאה מהשימוש בכל אחד מהם מטרה.
הטיית מיקום בציון
סיכוי נמוך יותר שילחצו על פריטים שמופיעים במיקום נמוך יותר מאשר פריטים שמופיעים במיקום גבוה יותר במסך. עם זאת, כאשר אתה מדרג סרטונים, בדרך כלל המערכת לא יודעת איפה במסך יופיע הקישור לסרטון הזה יופיעו בסופו של דבר. גם שליחת שאילתה למודל עם כל המיקומים האפשריים יקרות. גם אם ניתן להריץ שאילתה על מספר מיקומים, המערכת עדיין ייתכן שלא יבחינו בדירוג עקבי במספר דירוגי דירוגים.
פתרונות
- יצירת דירוגים שלא תלויים במיקום.
- דרגו את כל המועמדים כאילו הם במיקום העליון במסך.