Słowniczek z systemami uczącymi się: systemy rekomendacji

Ta strona zawiera glosariusz z systemu rekomendacji. Dla wszystkich terminów używanych w glosariuszu kliknij tutaj.

C

generacja kandydatów

#recsystems

Początkowy zestaw rekomendacji wybrany przez systemem rekomendacji. Weź na przykład pod uwagę która oferuje 100 000 książek. Faza generowania kandydatów tworzy czyli znacznie krótszej listy książek odpowiednich dla konkretnego użytkownika, np. 500. Ale nawet jeśli 500 książek to za dużo, aby polecić użytkownikowi. Kolejne, droższe poszczególnych etapów systemu rekomendacji (takich jak punktacja czy ponowne pozycjonowanie) pozwala zredukować te 500 do znacznie mniejszej, przydatniejszy zestaw rekomendacji.

filtrowanie podczas współpracy

#recsystems

prognozowanie zainteresowań jednego użytkownika, na podstawie zainteresowań wielu innych użytkowników. Wspólne filtrowanie jest często wykorzystywany w systemach rekomendacji.

I

macierz elementów

#recsystems

W systemach rekomendacji macierz wektorów dystrybucyjnych wygenerowanych przez rozkład macierzy z ukrytymi sygnałami dotyczącymi każdego elementu. Każdy wiersz macierzy elementów zawiera wartość pojedynczego utajonego dla wszystkich elementów. Weźmy na przykład system rekomendacji filmów. Każda kolumna matrycy elementów oznacza jeden film. Utajone sygnały mogą reprezentować gatunki lub być trudniejsze do zinterpretowania które obejmują złożone interakcje między gatunkami, gwiazdami wieku filmu lub innych czynników.

Macierz elementów ma taką samą liczbę kolumn jak miejsce docelowe która jest obliczana na czynniki pierwsze. Na przykład dla filmu system rekomendacji oceniający 10 000 tytułów filmów, macierz elementów będzie zawierać 10 000 kolumn.

items

#recsystems

W systemie rekomendacji jednostki, które co zaleca system. Na przykład filmy to produkty dostępne w sklepie z filmami. polecane przez księgarnię, natomiast książki to produkty polecane przez księgarnię.

M

rozkład na czynniki w postaci macierzy

#recsystems

W matematyce mechanizm znajdowania macierzy, których iloczyn skalarny przybliża lub macierz docelowych celów.

W systemach rekomendacji tablica docelowa często zawiera ocen w produktach. Na przykład wartość docelowa dla systemu rekomendacji filmów może wyglądać po nim, gdzie dodatnie liczby całkowite to oceny użytkowników, a 0 oznacza, że użytkownik nie ocenił filmu:

  Casablanca Historia Filadelfii Czarna Pantera Wonder Woman Pulp fiction
Użytkownik 1 5,0 3,0 0,0 2,0 0,0
Użytkownik 2 4.0 0,0 0,0 1,0 5,0
Użytkownik 3 3,0 1,0 4.0 5,0 0,0

System rekomendacji filmów ma na celu przewidywanie ocen użytkowników filmów bez oceny. Na przykład: czy Użytkownik 1 lubi Czarną Panterę?

Jedną z metod stosowanych w systemach rekomendacji jest stosowanie macierzy na czynniki w celu wygenerowania dwóch następujących macierzy:

Na przykład za pomocą rozkładu na 3 użytkowników i 5 elementów może zwrócić następującą macierz użytkowników i tablicę elementów:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Iloczyn skalarny macierzy użytkownika i tablicy elementów generuje rekomendację tablica zawierająca nie tylko oryginalne oceny użytkowników, ale również prognozy pod kątem filmów, których nie widział żaden użytkownik. Weźmy na przykład ocenę użytkownika 1 Casablanca, która wynosiła 5, 0. Kropka iloczyn odpowiadające tej komórce w macierzy rekomendacji powinien mam nadzieję, że będzie to mniej więcej 5.0 i będzie to:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Co ważniejsze, czy Użytkownik 1 lubi Czarną Panterę? Iloczyn skalarny odpowiadająca pierwszemu wierszowi, a trzecia kolumna daje prognozowany ocena 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

Rozkład macierzy zazwyczaj generuje macierz użytkowników i elementy, które są znacznie bardziej zwarte niż macierz docelowy.

R

system rekomendacji

#recsystems

System, który wybiera dla każdego użytkownika stosunkowo mały zestaw pożądanych items z dużego korpusu. Na przykład system rekomendacji może polecić 2 filmy: spośród 100 000 filmów,wybierając Casablanca, The Philadelphia Story dla 1 użytkownika, a Wonder Woman i Czarna Pantera. System rekomendacji filmów może w oparciu o takie czynniki jak:

  • Filmy ocenione lub obejrzane przez podobnych użytkowników.
  • Gatunek, reżyserzy, aktorzy, docelowa grupa demograficzna...

ponowne rankingi

#recsystems

Ostatni etap systemu rekomendacji, podczas których zadania z oceną mogą zostać ponownie ocenione według innych (zwykle nie jest to algorytm ML). Ponowne pozycjonowanie ocenia listę produktów generowane w ramach oceniania, na przykład:

  • Usuwanie produktów, które użytkownik już kupił.
  • Poprawia wynik nowych produktów.

S

ocena

#recsystems

Element systemu rekomendacji, który podaje wartość lub ranking każdego elementu utworzonego przez generowanie kandydatów.

U

lista użytkowników

#recsystems

W systemach rekomendacji Wektor umieszczania wygenerowany przez rozkład macierzy który zawiera ukryte sygnały dotyczące preferencji użytkownika. Każdy wiersz macierzy użytkowników zawiera informacje o względnej siły różnych ukrytych sygnałów w przypadku pojedynczego użytkownika. Weźmy na przykład system rekomendacji filmów. W tym systemie utajone sygnały w tablicy użytkowników mogą reprezentować zainteresowania poszczególnych użytkowników związanych z konkretnymi gatunkami lub mogą być trudniejsze do zinterpretowania, złożone interakcje między wieloma czynnikami.

Macierz użytkowników zawiera po 1 kolumnie na każdą funkcję utajnioną i dla każdego użytkownika. Oznacza to, że tablica użytkowników zawiera taką samą liczbę wierszy jak miejsce docelowe która jest obliczana na czynniki pierwsze. Na przykład dla filmu dla 1 000 000 użytkowników, tablica użytkowników będzie miała 1 000 000 wierszy.

W

Naprzemienne najmniejsze kwadraty ważone (WALS)

#recsystems

Algorytm minimalizujący funkcję celu podczas rozkładania macierzy w systemów rekomendacji, uwzględnianie brakujących przykładów. WALS minimalizuje ważone wartości błąd do kwadratu między pierwotną macierą a odbudową przez naprzemiennego rozłożenia na czynniki pierwsze z osobna. Każdą z tych optymalizacji można rozwiązać przez użycie najmniejszych kwadratów optymalizację wypukłą. Więcej informacji: kurs dotyczący systemów Recommendations Systems.