מילון מונחים ללמידת מכונה: מערכות המלצה

בדף הזה מפורטים מונחים מתוך מילון המונחים של מערכות ההמלצות. כאן מפורטות כל ההגדרות במילון.

C

יצירת שילובים אפשריים למיקוד

#recsystems

הקבוצה הראשונית של ההמלצות שנבחרה על ידי מערכת המלצות. לדוגמה, נניח שיש חנות ספרים שמציעה 100,000 כותרים. בשלב יצירת המועמדים נוצרת רשימה קטנה בהרבה של ספרים מתאימים למשתמש מסוים, למשל 500 ספרים. אבל גם 500 ספרים הם יותר מדי כדי להמליץ למשתמש. בשלבים הבאים של מערכת ההמלצות, שהם יקרים יותר (כמו מתן ציונים ודירוג מחדש), 500 ההמלצות האלה מצטמצמות לקבוצה קטנה בהרבה של המלצות מועילות יותר.

מידע נוסף זמין בסקירה הכללית על יצירת מועמדים בקורס 'מערכות המלצות'.

סינון שיתופי

#recsystems

ביצוע תחזיות לגבי תחומי העניין של משתמש אחד על סמך תחומי העניין של משתמשים רבים אחרים. סינון שיתופי משמש לעיתים קרובות במערכות המלצות.

מידע נוסף זמין בקטע סינון שיתופי בקורס 'מערכות המלצות'.

I

מטריצת פריטים

#recsystems

במערכות המלצות, מטריצת ווקטורים של הטמעה שנוצרה על ידי פירוק מטריצות שמכילה אותות סמויים לגבי כל פריט. כל שורה במטריצה של הפריטים מכילה את הערך של מאפיין סמוי אחד לכל הפריטים. לדוגמה, ניקח מערכת המלצות לסרטים. כל עמודה במטריצה של הפריטים מייצגת סרט אחד. האותות הלא גלויים יכולים לייצג ז'אנרים, או אותות שקשה יותר לפרש שכוללים אינטראקציות מורכבות בין ז'אנר, שחקנים, גיל הסרט או גורמים אחרים.

למטריצה של הפריטים יש את אותו מספר עמודות כמו למטריצה היעד שמתבצעת בה גורמיזציה. לדוגמה, אם יש מערכת הממליצה על סרטים ומעריכה 10,000 שמות של סרטים, למטריצה של הפריטים יהיו 10,000 עמודות.

פריטים

#recsystems

במערכת המלצות, הישויות שהמערכת ממליצה עליהן. לדוגמה, סרטונים הם הפריטים שחנויות וידאו ממליצות עליהם, בעוד שספרים הם הפריטים שחנויות ספרים ממליצות עליהם.

M

פירוק מטריצות

#recsystems

במתמטיקה, מנגנון למציאת המטריצות שהמכפלה שלהן קרובה למטריצה היעד.

במערכות המלצות, לרוב מטריצת היעד מכילה את הדירוגים של המשתמשים בפריטים. לדוגמה, מטריצת היעד של מערכת המלצות לסרטים עשויה להיראות כך, כאשר המספרים החיוביים הם דירוגי המשתמשים והערך 0 מציין שהמשתמש לא נתן דירוג לסרט:

  קזבלנקה סיפור פילדלפיה הפנתר השחור וונדר וומן Pulp Fiction
משתמש 1 5.0 3.0 0.0 2.0 0.0
משתמש 2 4.0 0.0 0.0 1.0 5.0
משתמש 3 3.0 1.0 4.0 5.0 0.0

מטרת מערכת ההמלצות לסרטים היא לחזות את דירוגי המשתמשים בסרטים ללא סיווג. לדוגמה, האם משתמש 1 יאהב את הפנתר השחור?

אחת מהגישות ליצירת מערכות המלצות היא להשתמש בפירוק מטריצות כדי ליצור את שתי המטריצות הבאות:

לדוגמה, שימוש בפירוק מטריצות על שלושת המשתמשים וחמשת הפריטים שלנו יכול להניב את מטריצת המשתמשים ואת מטריצת הפריטים הבאות:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

מכפלת המכונים של מטריצת המשתמשים ומטריצת הפריטים מניבה מטריצת המלצות שמכילה לא רק את הדירוגים המקוריים של המשתמשים, אלא גם תחזיות לגבי הסרטים שכל משתמש לא צפה בהם. לדוגמה, נניח שמשתמש 1 נתן ל-Casablanca דירוג של 5.0. המכפלה של הנקודות שתואם לתא הזה במטריצה של ההמלצות אמורה להיות בערך 5.0, והיא:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

חשוב יותר, האם למשתמש 1 יהנה מהסרט הפנתר השחור? כשמעריכים את המכפלה של השורה הראשונה בעמודה השלישית, מקבלים דירוג צפוי של 4.3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

בדרך כלל, גורם המטריצה מניב מטריצה של משתמשים ומטריצה של פריטים, ושניהם יחד קטנים בהרבה מהמטריצה היעד.

R

מערכת המלצות

#recsystems

מערכת שבוחרת לכל משתמש קבוצה קטנה יחסית של פריטים רצויים מתוך מאגר גדול. לדוגמה, מערכת המלצות לסרטונים עשויה להמליץ על שני סרטונים מתוך מאגר של 100,000 סרטונים, ולבחור את הסרטים קזבלנקה והסיפור על פילדלפיה למשתמש אחד, ואת הסרטים וונדר וומן והפנתר השחור למשתמש אחר. מערכת המלצות לסרטונים עשויה להסתמך על גורמים כמו:

  • סרטים שדירגתם או צפיתם בהם, וגם סרטים שדירגו או צפו בהם משתמשים דומים.
  • ז'אנר, במאים, שחקנים, דמוגרפיית יעד...

מידע נוסף זמין בקורס 'מערכות המלצות'.

דירוג מחדש

#recsystems

השלב האחרון במערכת המלצות, שבמהלכו יכול להיות שפריטים שקיבלו ציונים יקבלו ציונים מחדש לפי אלגוריתם אחר (בדרך כלל, לא למידת מכונה). במסגרת הדירוג מחדש, מערכת Analytics מבצעת הערכה של רשימת הפריטים שנוצרה בשלב הניקוד, ומבצעת פעולות כמו:

  • הסרת פריטים שהמשתמש כבר רכש.
  • שיפור הדירוג של פריטים עדכניים יותר.

מידע נוסף זמין בקטע דירוג מחדש בקורס 'מערכות המלצות'.

S

ציון

#recsystems
#Metric

החלק במערכת ההמלצות שמספק ערך או דירוג לכל פריט שנוצר בשלב יצירת המועמדים.

U

מטריצת משתמשים

#recsystems

במערכות המלצות, וקטור הטמעה שנוצר על ידי פירוק מטריצות שמכיל אותות סמויים לגבי העדפות המשתמשים. כל שורה במטריצה של המשתמש מכילה מידע על העוצמה היחסית של אותות סמויים שונים של משתמש יחיד. לדוגמה, ניקח מערכת המלצות לסרטים. במערכת הזו, האותות הלא גלויים במטריצה של המשתמשים עשויים לייצג את תחומי העניין של כל משתמש בז'אנרים מסוימים, או אותות שקשה יותר לפרש שכוללים אינטראקציות מורכבות בין כמה גורמים.

למטריצת המשתמשים יש עמודה לכל מאפיין סמוי ושורה לכל משתמש. כלומר, למטריצה של המשתמשים יש את אותו מספר שורות כמו למטריצה היעד שמתבצעת בה גורמיזציה. לדוגמה, אם יש מערכת המלצות לסרטים ל-1,000,000 משתמשים, למטריצה של המשתמשים יהיו 1,000,000 שורות.

W

Weighted Alternating Least Squares ‏ (WALS)

#recsystems

אלגוריתם למזעור פונקציית היעד במהלך פירוק מטריצות במערכות המלצות, שמאפשר להפחית את המשקל של הדוגמאות החסרות. כדי למזער את השגיאה המשוקללת הריבונית בין המטריצה המקורית לבין השחזור, ה-WALS מחליף בין תיקון הפירוק של השורות לבין תיקון הפירוק של העמודות. אפשר לפתור כל אחת מהאופטימיזציות האלה באמצעות אופטימיזציה קונית של ריבועים קטנים. פרטים נוספים זמינים בקורס 'מערכות המלצות'.