Ta strona zawiera hasła z glosariusza dotyczące systemów rekomendacji. Aby poznać wszystkie terminy z glosariusza, kliknij tutaj.
C
generowanie kandydatów
Początkowy zestaw rekomendacji wybrany przez system rekomendacji. Weźmy na przykład księgarnię, która oferuje 100 tys. tytułów. Faza generowania kandydatów tworzy znacznie mniejszą listę odpowiednich książek dla danego użytkownika, na przykład 500 książek. Ale nawet 500 książek to za dużo, aby polecić je użytkownikowi. Kolejne, droższe fazy systemu rekomendacji (np. ocenianie i ponownie ustalanie rankingu) ograniczają te 500 wartości do znacznie mniejszego, bardziej przydatnego zestawu rekomendacji.
Więcej informacji znajdziesz w omówieniu generowania kandydatów w Kursie z systemów rekomendacji.
filtrowanie grupowe
przewidywania zainteresowań jednego użytkownika na podstawie zainteresowań wielu innych użytkowników; Filtrowanie oparte na współpracy jest często używane w systemach rekomendacji.
Więcej informacji znajdziesz w temacie filtrowania współpracy w kursie dotyczącym systemów rekomendacji.
I
tablica elementów
W systemach rekomendacji jest to macierz wektorów zastępczych wygenerowana przez faktoryzację macierzy, która zawiera ukryte sygnały dotyczące każdego elementu. Każdy wiersz macierzy elementów zawiera wartość pojedynczej cechy ukrytej dla wszystkich elementów. Weźmy na przykład system rekomendacji filmów. Każda kolumna w macierz elementów odpowiada jednemu filmowi. Te ukryte sygnały mogą reprezentować gatunki lub mogą być trudniejsze do interpretacji sygnały, które obejmują złożone interakcje między gatunkiem, gwiazdami, wiekiem filmu lub innymi czynnikami.
Macierz elementów ma taką samą liczbę kolumn co docelowa macierz, która jest czynnikowana. Jeśli np. system rekomendacji filmów ocenia 10 tys. tytułów, ma 10 tys. kolumn.
items
W systemie rekomendacji są to elementy, które system rekomenduje. Na przykład filmy to produkty rekomendowane przez sklep z filmami, a książki to produkty rekomendowane przez księgarnię.
M
rozkład macierzy,
W matematyce mechanizm znajdowania macierz, których iloczyn skalarny jest przybliżeniem do macierzy docelowej.
W systemach rekomendacji tablica docelowych danych często zawiera oceny elementów przez użytkowników. Na przykład docelowa tablica dla systemu rekomendacji filmów może wyglądać tak: dodatnie liczby całkowite to oceny użytkowników, a 0 oznacza, że użytkownik nie ocenił filmu:
Casablanca | The Philadelphia Story | Czarna Pantera | Wonder Woman | Pulp Fiction | |
---|---|---|---|---|---|
Użytkownik 1 | 5,0 | 3,0 | 0,0 | 2,0 | 0,0 |
Użytkownik 2 | 4.0 | 0,0 | 0,0 | 1,0 | 5,0 |
Użytkownik 3 | 3,0 | 1,0 | 4.0 | 5,0 | 0,0 |
System rekomendacji filmów ma przewidywać oceny użytkowników w przypadku filmów bez oceny. Czy na przykład użytkownik 1 spodobała się Czarna Pantera?
Jednym z podejść do systemów rekomendacji jest użycie czynnika macierzowego do wygenerowania tych 2 macierzy:
- macierz użytkownika o postaci liczby użytkowników X liczba wymiarów wstawiania.
- macierz elementów o postaci liczby wymiarów zanurzonych wymiarów X liczba elementów.
Na przykład zastosowanie czynnikowej analizy macierzy w przypadku 3 użytkowników i 5 produktów może dać następującą macierz użytkowników i macierzy produktów:
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
Punktowy iloczyn macierzy użytkowników i macierzy elementów daje macierz rekomendacji, która zawiera nie tylko oryginalne oceny użytkowników, ale także prognozy dotyczące filmów, których dany użytkownik nie widział. Użytkownik 1 ocenił film Casablanca na 5,0. Produkt skalarny odpowiadający tej komórce w macierz rekomendacji powinien wynosić około 5, 0.W tym przypadku jest to:
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
Co ważniejsze, czy użytkownik 1 polubi film Czarna Pantera? Wynik mnożenia wektorów odpowiadających pierwszemu wierszowi i trzeciej kolumnie to przewidywana ocena 4,3:
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
Rozkład macierzy zwykle daje macierz użytkowników i macierz elementów, które razem są znacznie bardziej zwarte niż macierz docelowa.
R
system rekomendacji
System, który wybiera dla każdego użytkownika stosunkowo niewielki zestaw pożądanych elementów z dużego zbioru. System rekomendacji filmów może na przykład polecić 2 filmy z korpusu 100 tys. filmów, wybierając Casablancę i Philadelphia Story dla jednego użytkownika oraz Wonder Woman i Czarna pantera dla drugiego. System rekomendacji filmów może opierać swoje rekomendacje na takich czynnikach jak:
- filmy, które ocenili lub obejrzeli użytkownicy o podobnych zainteresowaniach;
- Gatunek, reżyserzy, aktorzy, grupa docelowa...
ponowne ustalanie rankingu
Ostatni etap systemu rekomendacji, podczas którego elementy z oceniami mogą zostać ponownie ocenione według innego algorytmu (zwykle innego niż ML). Ponowne ustalanie rankingu polega na ocenie listy elementów wygenerowanej w etap określania wartości, w którym podejmowane są takie działania jak:
- usuwanie elementów, które użytkownik już kupił;
- Zwiększanie wyniku nowszych produktów.
S
ocena
Część systemu rekomendacji, która przypisuje wartość lub ranking do każdego elementu wygenerowanego w fazie generowania kandydatów.
U
tablica użytkowników
W systemach rekomendacji wektor zanurzeniowy jest generowany przez faktoryzację macierzy, która zawiera ukryte sygnały dotyczące preferencji użytkowników. Każdy wiersz macierzy użytkownika zawiera informacje o względnej sile różnych ukrytych sygnałów w przypadku pojedynczego użytkownika. Weźmy na przykład system rekomendacji filmów. W tym systemie sygnały ukryte w macierz użytkownika mogą reprezentować zainteresowanie poszczególnych użytkowników określonymi gatunkami lub mogą być trudniejsze do zinterpretowania sygnały, które obejmują złożone interakcje między wieloma czynnikami.
Macierz użytkowników zawiera kolumnę dla każdej cechy ukrytej i wiersz dla każdego użytkownika. Oznacza to, że macierz użytkowników ma taką samą liczbę wierszy jak macierz docelowa, która jest czynnikiem. Jeśli np. system rekomendacji filmów ma 1 000 000 użytkowników, matryca użytkowników będzie miała 1 000 000 wierszy.
W
Ważona metoda alternatywnych najmniejszych kwadratów (WALS)
Algorytm minimalizujący funkcję celu podczas faktoryzacji macierzy w systemach rekomendacji, który umożliwia obniżenie wagi przykładów, których brakuje. WALS minimalizuje ważoną średnią kwadratową różnicę między oryginalną matrycą a odtworzoną przez naprzemienny wybór sprowadzania do macierzy wierszy i kolumn. Każdą z tych optymalizacji można rozwiązać za pomocą konweksyjnej optymalizacji najmniejszych kwadratów. Więcej informacji znajdziesz w Kursie Systemy rekomendacji.