Glossario del machine learning: sistemi dei consigli

Questa pagina contiene i termini del glossario di Recommendation Systems. Per tutti i termini del glossario, fai clic qui.

C

generazione di candidati

#recsystems

L'insieme iniziale di consigli scelto da un sistema di consigli. Ad esempio, considera un libreria che offre 100.000 titoli. La fase di generazione dei candidati un elenco molto più ridotto di libri adatti a un determinato utente, ad esempio 500. Ma anche 500 libri sono troppi per poterli consigliare a un utente. In seguito, più costoso, fasi di un sistema di suggerimenti (come il punteggio e riclassificazione) riduci a molto meno questi 500, insieme di consigli più utili.

filtro collaborativo

#recsystems

Fare previsioni sugli interessi di un utente in base agli interessi di molti altri utenti. Filtro collaborativo viene spesso utilizzata nei sistemi di consigli.

I

matrice di elementi

#recsystems

Nei sistemi di consigli, una matrice di vettori di incorporamento generata fattorizzazione matriciale che contengono indicatori latenti su ogni elemento. Ogni riga della matrice contiene il valore di un singolo elemento latente per tutti gli articoli. Ad esempio, considera un sistema di consigli sui film. Ogni colonna nella matrice degli elementi rappresenta un singolo filmato. Gli indicatori latenti potrebbero rappresentare generi o essere più difficili da interpretare che implicano interazioni complesse tra genere, star all'età del film o ad altri fattori.

La matrice dell'elemento ha lo stesso numero di colonne del target matrice che viene fattorizzata. Ad esempio, dato un film sistema di consigli che valuta 10.000 titoli di film, matrice di elementi avrà 10.000 colonne.

elementi

#recsystems

In un sistema di consigli, le entità che consigliati da un sistema. Ad esempio, i video sono gli articoli di un video consiglia, mentre i libri sono gli articoli consigliati da una libreria.

M

fattorizzazione matriciale

#recsystems

In matematica, un meccanismo per trovare le matrici il cui prodotto scalare approssima un matrice target.

Nei sistemi di suggerimenti, la matrice target spesso conservano valutazioni su items. Ad esempio, il target per un sistema di consigli sui film potrebbe essere simile alla seguente, dove i numeri interi positivi sono le valutazioni degli utenti e 0 indica che l'utente non ha valutato il film:

  Casablanca La storia di Filadelfia Black Panther Wonder Woman Pulp novel
Utente 1 5,0 3,0 0.0 2.0 0.0
Utente 2 4.0 0.0 0.0 1,0 5,0
Utente 3 3,0 1,0 4.0 5,0 0.0

Il sistema di consigli sui film ha lo scopo di prevedere le valutazioni degli utenti per film senza classificazione. Ad esempio, all'utente 1 piacerà Black Panther?

Un approccio per i sistemi di suggerimenti è l'utilizzo di matrici la fattorizzazione per generare le due matrici seguenti:

  • Una matrice utente, formulata come il numero di utenti X il di dimensioni di incorporamento.
  • Una matrice di elementi, modellata come il numero di incorporamenti dimensioni X il numero di elementi.

Ad esempio, utilizziamo la fattorizzazione matriciale per i tre utenti e i cinque elementi potrebbe restituire la seguente matrice utente e matrice elemento:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Il prodotto scalare della matrice utente e della matrice elemento genera un suggerimento che contiene non solo le valutazioni originali degli utenti, ma anche le previsioni per i film che ogni utente non ha visto. Ad esempio, considera la valutazione dell'utente 1 su Casablanca, che era 5,0. Il punto prodotto corrispondente a quella cella nella matrice dei suggerimenti si spera che sia circa 5.0, ed è:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Ma soprattutto, l'utente 1 apprezzerà Black Panther? Prendi il prodotto scalare corrispondente alla prima riga e alla terza colonna restituisce una previsione valutazione di 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La fattorizzazione matriciale dà in genere una matrice utente e una matrice di elementi che, sono molto più compatte della matrice target.

R

sistema di suggerimenti

#recsystems

Un sistema che seleziona per ogni utente un gruppo relativamente piccolo di elementi di un grande corpus. Ad esempio, un sistema di consigli per i video potrebbe consigliare due video da un corpus di 100.000 video, tra cui Casablanca e The Philadelphia Story per un utente, Wonder Woman e Black Panther per un altro. Un sistema di consigli per i video basare i suoi consigli su fattori quali:

  • Film che utenti simili hanno valutato o guardato.
  • Genere, registi, attori, gruppi demografici di destinazione...

riassegnazione

#recsystems

La fase finale di un sistema di consigli durante i quali gli elementi con un punteggio possono essere rivalutati in base ad altri (di solito, non ML). Il nuovo ranking valuta l'elenco di articoli generate dalla fase di punteggio, con azioni quali:

  • Eliminando gli articoli che l'utente ha già acquistato.
  • Miglioramento del punteggio degli articoli più recenti.

S

calcolo punteggio

#recsystems

La parte di un sistema di consigli che fornisce un valore o un ranking per ogni articolo prodotto dal nella fase di generazione dei candidati.

U

matrice utente

#recsystems

Nei sistemi di consigli, una vettore di incorporamento generato da fattorizzazione matriciale che contengono indicatori latenti sulle preferenze dell'utente. Ogni riga della matrice utente contiene informazioni sul relativo l'intensità di vari indicatori latenti per un singolo utente. Ad esempio, considera un sistema di consigli sui film. In questo sistema, i segnali latenti nella matrice dell'utente possono rappresentare l'interesse di ciascun utente generi specifici o potrebbero essere segnali di difficile interpretazione che implicano interazioni complesse su più fattori.

La matrice utente ha una colonna per ogni caratteristica latente e una riga per ogni utente. Ciò significa che la matrice utente ha lo stesso numero di righe del target matrice che viene fattorizzata. Ad esempio, dato un film di consigli per 1.000.000 utenti, la matrice dell'utente avrà 1.000.000 di righe.

M

Alternativa ponderata (WALS)

#recsystems

Un algoritmo per ridurre al minimo la funzione obiettivo durante scomposizione matriciale in sistemi di consigli, che consentono sottoponderazione degli esempi mancanti. WALS minimizza il carico errore quadratico tra la matrice originale e la ricostruzione per alternando la fattorizzazione delle righe a quella delle colonne. Ognuna di queste ottimizzazioni può essere risolta con i minimi quadrati ottimizzazione convessa: Per maggiori dettagli, consulta Recommendation Systems.