מילון מונחים ללמידת מכונה: מערכות המלצה

הדף הזה מכיל מונחים ממילון המונחים של Recommendation Systems. לכל המונחים במילון המונחים, יש ללחוץ כאן.

C

יצירת מועמדים

#recsystems

הקבוצה הראשונית של ההמלצות שנבחרו על ידי מערכת ההמלצות. לדוגמה, כדאי לקחת בחשבון חנות ספרים שמציעה 100,000 כותרים. שלב יצירת המועמדים רשימה קטנה הרבה יותר של ספרים שמתאימים למשתמש מסוים, למשל 500. אבל אפילו המספר של 500 ספרים גדול מדי ואי אפשר להמליץ עליו למשתמש. הבאות, יקרות יותר, בשלבים השונים במערכת המלצות (כמו ניקוד דירוג מחדש) מפחיתים את הערכים של 500 הערכים האלה להקטנה משמעותית יותר, הצגת המלצות מועילות יותר.

סינון שיתופי

#recsystems

חיזויים לגבי תחומי העניין של משתמש מסוים. על סמך תחומי העניין של משתמשים רבים אחרים. סינון משותף משתמשים בו בדרך כלל במערכות המלצות.

I

מטריצת פריטים

#recsystems

במערכות ההמלצות, של וקטורים של הטמעה שנוצרה על ידי פירוק לגורמים של מטריצות שכולל אותות נסתרים לגבי כל פריט. כל שורה במטריצת הפריטים מכילה את הערך של אובייקט לטנטי יחיד לכל הפריטים. לדוגמה, נבחן מערכת המלצות על סרטים. כל עמודה במטריצת הפריטים שמייצגת סרט אחד. האותות הסמויים שמייצג ז'אנרים או שלפעמים יהיה קשה יותר לפרש אותו אותות שכוללים אינטראקציות מורכבות בין ז'אנרים, כוכבים, של סרט מסוים, או גורמים אחרים.

במטריצת הפריטים יש אותו מספר עמודות כמו ביעד שמפירים לגורמים את המטריצה. לדוגמה, כשמזינים סרט מערכת המלצות שמעריכה 10,000 כותרי סרטים, מטריצת הפריטים תכלול 10,000 עמודות.

פריטים

#recsystems

במערכת המלצות, הישויות שמערכת ממליצה עליהם. לדוגמה, סרטונים הם הפריטים בחנות סרטונים מומלץ, ואילו ספרים הם הפריטים שמומלצים על ידי חנות ספרים.

M

פירוק לגורמים של מטריצות

#recsystems

במתמטיקה, מנגנון למציאת המטריצות שמכפלה שלהן קרובה במטריצת היעד.

במערכות ההמלצות, מטריצת היעד כוללת לעיתים קרובות דירוגים של פריטים. לדוגמה, היעד למערכת המלצות לסרטים עשויה להיראות בערך כך כאשר המספרים השלמים החיוביים הם דירוגי משתמשים, ו-0 מציין שהמשתמש לא דרג את הסרט:

  קזבלנקה הסיפור של פילדלפיה הפנתר השחור וונדר וומן ספרות זולה
משתמש 1 5.0 3.0 0.0 2.0 0.0
משתמש 2 4.0 0.0 0.0 1.0 5.0
משתמש 3 3.0 1.0 4.0 5.0 0.0

מטרת מערכת ההמלצות על סרטים היא לחזות את דירוגי המשתמשים לגבי סרטים ללא סיווג תוכן. לדוגמה, האם משתמש 1 יאהב את הפנתר השחור?

אחת מהגישה במערכות של המלצות היא להשתמש במטריצות פירוק לגורמים כדי ליצור את שתי המטריצות הבאות:

לדוגמה, שימוש בפקודת מטריצות עבור שלושת המשתמשים וחמישה פריטים יכולה להניב את מטריצת המשתמשים ומטריצת הפריטים הבאה:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

המכפלה של מטריצת המשתמשים ומטריצת הפריטים יוצרת המלצה מטריצה שמכילה לא רק את דירוגי המשתמשים המקוריים אלא גם חיזויים של סרטים שכל משתמש לא ראה. לדוגמה, נניח שהדירוג של משתמש 1 הוא קזבלנקה, שהוא 5.0. הנקודה של המוצר שתואם לתא הזה במטריצת ההמלצות היא בסביבות 5.0, והיא:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

וחשוב יותר, האם משתמש 1 יאהב את הפנתר השחור? שימוש במכפלת הנקודות שתואם לשורה הראשונה והעמודה השלישית מניבה דירוג של 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

פירוק לגורמים של מטריצות בדרך כלל מניב מטריצת משתמשים ומטריצת פריטים אשר ביחד, הן הרבה יותר קומפקטיות ממטריצת היעד.

R

מערכת המלצות

#recsystems

מערכת שבוחרת עבור כל משתמש קבוצה קטנה יחסית של items מתוך אוסף גדול. לדוגמה, מערכת המלצות על סרטונים עשויה להמליץ על שני סרטונים מתוך קורפוס של 100,000 סרטונים, בחירה בקזבלנקה הסיפור של פילדלפיה למשתמש אחד, ול-Wonder Woman פנתר שחור לצד אחר. מערכת המלצות על סרטונים עשויה מבססת את ההמלצות שלו על גורמים כמו:

  • סרטים שמשתמשים דומים דירגו או צפו בהם.
  • ז'אנר, במאים, שחקנים, טירגוט דמוגרפי...

דירוג מחדש

#recsystems

השלב האחרון של מערכת המלצות, במהלך התקופה הזו, פריטים שקיבלו ציון עשויים לקבל ציון מחדש בהתאם אלגוריתם (בדרך כלל לא למידת מכונה). בדירוג מחדש מתבצעת הערכה של רשימת הפריטים שנוצר על ידי שלב הניקוד, תוך ביצוע פעולות כמו:

  • הסרת פריטים שהמשתמש כבר קנה.
  • העלאת הדירוג של פריטים חדשים יותר.

S

ניקוד

#recsystems

החלק במערכת המלצות מספקת ערך או דירוג לכל פריט שמופק יצירת מועמדים.

U

מטריצת משתמשים

#recsystems

במערכות ההמלצות, וקטור הטמעה שנוצר על ידי פירוק לגורמים של מטריצות שכולל אותות נסתרים לגבי העדפות המשתמשים. כל שורה במטריצת המשתמשים מכילה מידע על העוצמה של אותות לטנטיים שונים של משתמש יחיד. לדוגמה, נבחן מערכת המלצות על סרטים. במערכת הזאת, האותות הלטנטיים במטריצת המשתמשים עשויים לייצג את העניין של כל משתמש ז'אנרים מסוימים, או אותות שקשה יותר להבין אותם באינטראקציות מורכבות שונות עם גורמים שונים.

מטריצת המשתמשים כוללת עמודה לכל תכונה חבויה ושורה לכל משתמש. כלומר, במטריצת המשתמשים יש אותו מספר שורות כמו ביעד שמפירים לגורמים את המטריצה. לדוגמה, כשמזינים סרט למערכת המלצות עבור 1,000,000 משתמשים, מטריצת המשתמשים תכלול 1,000,000 שורות.

W

ריבועים נמוכים יותר משוקללים (WALS)

#recsystems

אלגוריתם לצמצום פונקציית היעד במהלך פירוק לגורמים של מטריצות ב- מערכות המלצות, שמאפשרות הפחתת שקלול של הדוגמאות החסרות. WALS ממזער את בריבוע בין המטריצה המקורית לבין השחזור לפי ביצוע לסירוגין בין תיקון הפירוק לגורמים של שורות לבין פירוק לגורמים של עמודות. אפשר לפתור כל אחת מהאופטימיזציות האלה באמצעות ריבועים לפחות אופטימיזציה של המרות קמורות. פרטים נוספים זמינים במאמר הקורס Recommendation Systems.