מילון מונחים ללמידת מכונה: מערכות להמלצות

הדף הזה מכיל מונחים של מילון מונחים בנושא המלצות. לעיון בכל המונחים של מילון המונחים, לחצו כאן.

ג'

יצירת מועמדים

#recsystems

קבוצת ההמלצות הראשונית שנבחרה על ידי מערכת המלצות. לדוגמה, נניח שיש לכם חנות ספרים שמציעה 100,000 ספרים. שלב יצירת המועמדים יוצר רשימה קטנה הרבה יותר של ספרים מתאימים למשתמש מסוים, למשל 500. אבל אפילו 500 ספרים הם יותר מדי המלצות למשתמש. השלבים הבאים, היקרים יותר, והיקרים יותר של מערכת המלצות (כמו דירוג ודירוג מחדש) מפחיתים את 500 ההמלצות האלה להמלצות שהן הרבה יותר קטנות.

סינון שיתופי

#recsystems

יצירת חיזויים לגבי תחומי העניין של משתמש אחד על סמך תחומי העניין של משתמשים רבים אחרים. לעיתים קרובות משתמשים בסינון משותף במערכות המלצה.

I

מטריצת פריטים

#recsystems

במערכות המלצות, מטריצה של וקטורים של הטמעה שנוצרת על ידי פקטורים של מטריצה שמכילה אותות נסתרים לגבי כל פריט. כל שורה במטריצה של הפריט מחזיקה בערך של תכונה נפרדת להסתרה עבור כל הפריטים. לדוגמה, אפשר לחשוב על מערכת המלצות לסרטים. כל עמודה במטריצת הפריטים מייצגת סרט אחד. האותות החבויים עשויים לייצג ז'אנרים, או שהם מסובכים יותר לפירוש של אינטראקציות מורכבות בין ז'אנרים, כוכבים, גיל הסרטים או גורמים אחרים.

מטריצת הפריטים כוללת את אותו מספר עמודות כמו מטריצת היעד שמוחלת. לדוגמה, בהינתן מערכת המלצות לסרטים שמעריכה 10,000 שמות של סרטים, מטריצת הפריטים תכלול 10,000 עמודות.

items

#recsystems

במערכת המלצות, הישויות שהמערכת ממליצה עליהן. לדוגמה, סרטונים הם הפריטים שחנות הסרטונים ממליצה עליהם, ואילו ספרים הם הפריטים שחנות הספרים ממליצה עליהם.

M

פקטורים של מטריצה

#recsystems

מתמטיקה, מנגנון למציאת המטריצות שמכפלת הנקודות שלהן על סמך מטריצת יעד.

במערכות ההמלצות, מטריצת היעד כוללת לעיתים קרובות את הדירוגים של המשתמשים בפריטים. לדוגמה, מטריצת היעד של המערכת להמלצה על סרטים עשויה להיראות בערך כך: כשהמספרים השלמים החיוביים הם דירוגי משתמשים, ו-0 המשמעות היא שהמשתמש לא דירג את הסרט:

  קזבלנקה הסיפור של פילדלפיה הפנתר השחור וונדר וומן ספרות זולה
משתמש 1 5.0 3.0 0.0 2.0 0.0
משתמש 2 4.0 0.0 0.0 1.0 5.0
משתמש 3 3.0 1.0 4.0 5.0 0.0

מערכת ההמלצות על סרטים נועדה לחזות את דירוגי המשתמשים לסרטים ללא סיווג. לדוגמה, האם משתמש 1 יאהב את הפנתר השחור?

אחת מהגישות למערכות להמלצות היא להשתמש בפקודה של מטריצה כדי ליצור את שתי המטריצות הבאות:

לדוגמה, שימוש במטריצת מטריצות בשלושת המשתמשים שלנו ובחמישה פריטים יכול להניב את מטריצת המשתמשים הבאה ואת מטריצת הפריטים:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

מוצר הנקודות של מטריצת המשתמשים ומטריצת הפריטים יוצר המלצה על מטריצת המלצות שמכילה לא רק את דירוגי המשתמשים המקוריים, אלא גם חיזויים לסרטים שכל משתמש לא ראה. לדוגמה, הדירוג של משתמש 1 לגבי קזבלנקה היה 5.0. מוצר הנקודות שתואם לתא הזה במטריצת ההמלצות צריך להיות בערך 5.0, והוא:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

חשוב מכך, האם משתמש 1 יאהב את הפנתר השחור? אם לוקחים את המוצר של הנקודה בהתאם לשורה הראשונה והעמודה השלישית, מתקבל דירוג חזוי של 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

פקטור מטריצות בדרך כלל מניב מטריצה של משתמשים ומטריצת פריטים שיחד הם קומפקטיים יותר באופן משמעותי ממטריצה היעד.

ימין

מערכת המלצות

#recsystems

מערכת שבוחרת עבור כל משתמש קבוצה קטנה יחסית של פריטים רצויים מתוך אוסף גדול. לדוגמה, מערכת המלצות לסרטונים עשויה להמליץ על שני סרטונים מתוך מקבץ של 100,000 סרטונים ולבחור באפשרות קזבלנקה והסיפור של פילדלפיה עבור משתמש אחד, ו-Wonder Woman והפנתר השחור עבור משתמש אחר. מערכת ההמלצות על סרטונים עשויה לבסס את ההמלצות שלה על גורמים כמו:

  • סרטים שמשתמשים דומים דירגו או צפו בהם.
  • ז'אנר, במאים, שחקנים, דמוגרפיה היעד...

דירוג חוזר

#recsystems

השלב האחרון של מערכת המלצות, שבמהלכו אפשר לתת ציונים מחדש לפריטים שקיבלו ציון בהתאם לאלגוריתם אחר (בדרך כלל לא למידת מכונה). הדירוג מחדש מעריך את רשימת הפריטים שנוצרו על ידי השלב הניקוד ומבצעים פעולות כמו:

  • ביטול פריטים שהמשתמש כבר רכש.
  • שיפור הדירוג של פריטים חדשים יותר.

S

ניקוד

#recsystems

החלק במערכת ההמלצות שנותן ערך או דירוג לכל פריט שנוצר בשלב יצירת המועמדים.

U

מטריצת משתמשים

#recsystems

במערכות המלצות, וקטור הטמעה שנוצר על ידי טריגר מטריצות שמכיל אותות נסתרים לגבי העדפות המשתמשים. כל שורה של מטריצת המשתמשים כוללת מידע על העוצמה היחסית של אותות נסתרים שונים עבור משתמש יחיד. לדוגמה, אפשר לחשוב על מערכת המלצות לסרטים. במערכת הזו, האותות המוסתרים במטריצת המשתמשים עשויים לייצג את תחומי העניין של כל משתמש בז'אנרים מסוימים, או שהם יכולים להיות קשים יותר לפענוח וקשורים לגורמים שונים בגורמים שונים.

במטריצה של המשתמש יש עמודה לכל תכונה נסתרת ושורה לכל משתמש. כלומר, מטריצת המשתמשים כוללת את אותו מספר שורות כמו מטריצת היעד שמוחלת. לדוגמה, בהינתן מערכת המלצות על סרטים ל-1,000,000 משתמשים, מטריצת המשתמשים תכלול 1,000,000 שורות.

W

ריבועים פחות משוקללים מתחלפים (WALS)

#recsystems

אלגוריתם למזעור הפונקציה האובייקטיבית במהלך הסקטור של מטריצה במערכות המלצה שמאפשר הפחתה נמוכה מדי של הדוגמאות החסרות. WALS ממזערת את השגיאה בריבוע המשוקללת בין המטריצה המקורית והשחזור על ידי תיקון בין פקטור השורות לבין פירוק העמודות. כל אחת משיטות האופטימיזציה יכולה להיפתר על ידי פחות מריבועים אופטימיזציה קמורה. לפרטים נוספים, אפשר לעיין בקורס של מערכת ההמלצות.