מילון מונחים ללמידת מכונה: מערכות להמלצות

הדף הזה מכיל מונחים של מילון המונחים 'מערכות המלצות'. לכל המונחים הקשורים למילון המונחים, יש ללחוץ כאן.

C

יצירת מועמדים

#recsystems

קבוצת ההמלצות הראשונית שנבחרה על ידי מערכת המלצות. לדוגמה, נניח שחנות ספרים שיש בה 100,000 ספרים. השלב של יצירת מועמדים יוצר רשימה קטנה בהרבה של ספרים מתאימים למשתמש מסוים, למשל 500. אבל אפילו 500 ספרים הם הרבה יותר מדי מומלצים למשתמש. בשלבים הבאים, יקר יותר, ויקר יותר, בעזרת מערכת המלצות (כמו ציון ודירוג מחדש), תקבלו 500 המלצות קטנות ומועילות יותר.

סינון שיתופי

#recsystems

יצירת חיזויים לגבי תחומי העניין של משתמש אחד על סמך תחומי העניין של משתמשים רבים אחרים. בדרך כלל משתמשים בפילטרים משותפים במערכות של המלצות.

I

מטריצת פריטים

#recsystems

במערכות ההמלצות, מטריצה של הטמיעות שנוצרה על ידי יצירת מטריצות שמכילה אותות נסתרים לגבי כל פריט. כל שורה במטריצת הפריטים מוסיפה את הערך של תכונה נסתרת אחת לכל הפריטים. לדוגמה, אפשר לבחור מערכת להמלצות על סרטים. כל עמודה במטריצת הפריט מייצגת סרט יחיד. האותות הנסתרים עשויים לייצג ז'אנרים, או שהאותות עשויים להיות קשים יותר לפענוח, וכוללים אינטראקציות מורכבות בין ז'אנרים, כוכבים, גיל סרטים או גורמים אחרים.

מטריצת הפריט מכילה את אותו מספר עמודות כמו מטריצת היעד שמשמשת לחישוב. לדוגמה, אם המערכת להמלצה על סרטים מעריכים 10,000 שמות של סרטים, מטריצת הפריט תכלול 10,000 עמודות.

items

#recsystems

במערכת המלצות, הישויות שהמערכת ממליצה עליהן. לדוגמה, סרטונים הם הפריטים שהומלצו על ידי חנות וידאו, וספרים הם הפריטים שמומלצים על ידי חנות ספרים.

M

מטריצת מטריצות

#recsystems

משוואה מתמטית, מנגנון למציאת המטריצות של מוצר המכפלה של מטריצת יעד.

במערכות המלצות, מטריצת היעד היא בדרך כלל שכוללת משתמשים' דירוגים בפריטים. לדוגמה, מטריצת היעד של מערכת המלצות לסרטים עשויה להיראות בערך כך:

  קזבלנקה הסיפור של פילדלפיה הפנתר השחור וונדר וומן ספרות אגדית
משתמש 1 5.0 3.0 0.0 2.0 0.0
משתמש 2 4.0 0.0 0.0 1.0 5.0
משתמש 3 3.0 1.0 4.0 5.0 0.0

מערכת ההמלצות לסרטים מתמקדת בחיזוי דירוגי משתמשים לסרטים ללא סיווג. לדוגמה, האם משתמש 1 כמו הפנתר השחור?

אחת הגישות למערכות המלצה היא שימוש בפקודה של מטריצות כדי ליצור את שתי המטריצות הבאות:

לדוגמה, שימוש בבדיקת מטריצות לשלושת המשתמשים שלנו וחמישה פריטים יכול להניב את מטריצת המשתמש ואת מטריצת הפריטים הבאים:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

מוצר הנקודה של מטריצת המשתמש ומטריצת הפריט יוצר מטריצת המלצות שמכילה לא רק את דירוגי המשתמשים המקוריים, אלא גם חיזויים לסרטים שכל משתמש לא ראה. לדוגמה, נניח שהדירוג של משתמש 1' קזבלנקה הוא 5.0. מוצר הנקודות המתאים לתא הזה במטריצת ההמלצות צריך להיות אמור להיות בערך 5.0, והוא:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

חשוב מכך, האם משתמש 1 כמו הפנתר השחור? שימוש במוצר של הנקודה התואם לשורה הראשונה ולעמודה השלישית מניב דירוג 4.3 צפוי:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

חישוב המטריצות מאפשר בדרך כלל מטריצת משתמש ומטריצת פריט שיחד, הקומפקטיות ביותר.

R

מערכת המלצות

#recsystems

מערכת שבוחרת לכל משתמש קבוצה קטנה יחסית של פריטים רצויים מתוך אוסף נתונים גדול. לדוגמה, מערכת ההמלצות על סרטונים עשויה להמליץ על שני סרטונים מתוך אוסף של 100,000 סרטונים, ולבחור באפשרות קזבלנקה ובסיפור פילדלפיה למשתמש אחד, ובהשוואה לוונדר וומן ולפנתר שחור. מערכת ההמלצות על סרטונים עשויה לבסס את ההמלצות על גורמים כמו:

  • סרטים שמשתמשים דומים דירגו או צפו בהם.
  • ז'אנר, במאי, שחקנים, דמוגרפיה לטירגוט...

דירוג מחדש

#recsystems

השלב האחרון במערכת ההמלצות, שמציין אילו פריטים שקיבלו ציון עשויים לעבור דירוג מחדש בהתאם לאלגוריתם אחר (בדרך כלל לא לפי למידת מכונה). הדירוג מחדש מעריך את רשימת הפריטים שנוצרת בשלב הניקוד, תוך ביצוע פעולות כמו:

  • ביטול פריטים שהמשתמש כבר רכש.
  • העלאת הדירוג של פריטים חדשים.

ש'

ניקוד

#recsystems

החלק של מערכת המלצות שמספקת ערך או דירוג של כל פריט שנוצר על ידי השלב יצירת מועמדים.

U

מטריצת משתמשים

#recsystems

במערכות המלצות, הטמעה שנוצרת על ידי יצירת מטריצות שמכילה אותות נסתרים לגבי העדפות המשתמשים. כל שורה של מטריצת המשתמש כוללת מידע על העוצמה היחסית של אותות שונים למשתמש יחיד. לדוגמה, אפשר לבחור מערכת להמלצות על סרטים. במערכת הזו, האותות הנסתרים במטריצת המשתמש עשויים לייצג את תחומי העניין של כל משתמש בז'אנרים מסוימים, או שהם עשויים להיות קשים יותר לפירוש, ומעורבים בהם אינטראקציות מורכבות.

מטריצת המשתמש כוללת עמודה עבור כל תכונה נסתרת ושורה עבור כל משתמש. כלומר, למטריצת המשתמש יש אותו מספר שורות כמו מטריצת היעד שמשמשת לחישוב. לדוגמה, לאור מערכת המלצות על סרטים ל-1,000,000 משתמשים, למטריצת המשתמש יהיו 1,000,000 שורות.

W

ריבועים פחות משוקללים מתחלפים (WALS)

#recsystems

אלגוריתם לצמצום הפונקציה האובייקטיבית במהלךהחישוב של מטריצות במערכות המלצות, המאפשר הפחתת משקל לדוגמאות החסרות. WALS מצמצמת את מספר השגיאות המשוקללות בין המטריצה המקורית לבין השחזור, באמצעות החלפה בין תיקון גורמי השורה לבין פירוק העמודות. אפשר לפתור כל אחת מפעולות האופטימיזציה על ידי ריבועים פחות אופטימיזציה של המרות. לקבלת פרטים, עיינו בקורס של מערכת ההמלצות