דירוג מחדש

בשלב האחרון של מערכת המלצות, המערכת יכולה לדרג מחדש את הדירוג של לשקול קריטריונים נוספים או מגבלות נוספות. אחת של דירוג מחדש היא להשתמש במסננים שמסירים מועמדים מסוימים.

גישה נוספת של דירוג מחדש היא שינוי ידני של הציון שהוחזר על ידי הדרגה.

בקטע הזה נדון בקצרה על עדכניות, מגוון והוגנות. יש רק גורמים רבים שיכולים לעזור לשפר את ההמלצה המערכת. חלק מהגורמים האלה מחייבים שינוי של שלבים שונים של התהליך. בכל קטע יוצגו פתרונות שניתן ליישם בנפרד או ביחד.

עדכניות

רוב מערכות ההמלצות מנסות לשלב את נתוני השימוש הכי עדכניים כמו היסטוריית המשתמש הנוכחית והפריטים החדשים ביותר. שמירה על עדכניות המודל עוזר למודל לתת המלצות טובות.

פתרונות

  • הפעילו מחדש את האימון לעתים קרובות ככל האפשר, כדי ללמוד על נתוני האימון העדכניים. מומלץ להתחיל את האימון במצב ביניים (warm start) כדי שלמודל לא ללמוד מחדש מאפס. הפעלה במצב חימום יכולה לצמצם משמעותית את האימון בזמן האימון. לדוגמה, בפירוק לגורמים של מטריצות, מפעילים במצב ביניים (warm start את ההטמעות) כדי שהיו קיימים במופע הקודם של המודל.
  • יצירת 'ממוצע' משתמש לייצוג משתמשים חדשים בפירוק לגורמים של מטריצות למשימות ספציפיות. אתם לא צריכים את אותה הטמעה לכל משתמש – יכול ליצור אשכולות של משתמשים על סמך תכונות של המשתמש.
  • משתמשים ב-DNN כמו מודל Softmax או מודל שני גדלים. מכיוון שהמודל לוקח של המאפיינים כקלט, הוא יכול לרוץ על שאילתה או פריט במהלך האימון.
  • הוספת גיל למסמך כתכונה. לדוגמה: מערכת YouTube יכולה להוסיף את הגיל של הסרטון או זמן הצפייה האחרונה שלו כתכונה.

תמונה של ארבעה סרטונים מומלצים בנושא ינשופים.

מגוון רחב

אם המערכת תמיד תמליץ על פריטים "הקרובים ביותר" לשאילתה המועמדים נוטים להיות דומים מאוד זה לזה. הזה היעדר גיוון עלול לגרום לחוויית משתמש גרועה או משעממת. לדוגמה, אם YouTube רק ממליץ על סרטונים שדומים מאוד לסרטון שהמשתמש שבו אתם צופים כרגע, כמו סרטונים של ינשוף. (כפי שמוצג באיור), סביר להניח שהמשתמש יאבד עניין במהירות.

פתרונות

  • אימון כמה מחוללי מועמדים באמצעות מקורות שונים.
  • מאמנים מספר מדרגים באמצעות פונקציות מטרה שונות.
  • כדי לשמור על מגוון תרבותי, חשוב לדרג מחדש את הפריטים לפי ז'אנר או מטא-נתונים אחרים.

יחס הוגן

המודל צריך להתייחס לכל המשתמשים בצורה הוגנת. לכן, צריך לוודא המודל לא לומד הטיות לא מודעות מנתוני האימון.

פתרונות

  • לכלול נקודות מבט מגוונות בעיצוב ובפיתוח.
  • לאמן מודלים של למידת מכונה על מערכי נתונים מקיפים. הוספת נתוני עזר כאשר בנתונים מועטים מדי (לדוגמה, כשקטגוריות מסוימות ).
  • לעקוב אחר המדדים (למשל, דיוק ושגיאה מוחלטת) בכל אחד מהמדדים כדי לזהות דעות קדומות.
  • יוצרים מודלים נפרדים לקבוצות שלא מקבלים גישה.