Glossario del machine learning: sistemi di suggerimenti

Questa pagina contiene i termini del glossario dei sistemi di suggerimenti. Per tutti i termini del glossario, fai clic qui.

C

generazione di candidati

#recsystems

L'insieme iniziale di consigli scelti da un sistema di suggerimenti. Prendiamo come esempio una libreria che offre 100.000 titoli. Nella fase di generazione dei candidati viene creato un elenco di libri molto più piccolo per un utente specifico, ad esempio 500. Tuttavia, anche 500 libri sono troppi per essere consigliati a un utente. Le fasi successive e più costose di un sistema di suggerimenti (ad es. punteggio e ranking) riducono questi 500 punti in un insieme di consigli molto più piccolo e utile.

filtro collaborativo

#recsystems

Fare previsioni sugli interessi di un utente in base agli interessi di molti altri utenti. Il filtro collaborativo viene spesso utilizzato nei sistemi di consigli.

I

matrice dell'elemento

#recsystems

Nei sistemi di suggerimento, una matrice di vettori di incorporamento generati dalla fattore di matrice che contiene indicatori latenti su ciascun elemento. Ogni riga della matrice dell'elemento contiene il valore di una singola funzionalità latente per tutti gli elementi. Prendi ad esempio un sistema di consigli per film. Ogni colonna nella matrice degli elementi rappresenta un singolo filmato. Gli indicatori latenti potrebbero rappresentare generi o potrebbero essere più difficili da interpretare che implicano interazioni complesse tra genere, stelle, età del film o altri fattori.

La matrice dell'elemento ha lo stesso numero di colonne della matrice di destinazione che viene fattorizzata. Ad esempio, se un sistema di suggerimenti di film valuta 10.000 titoli di film, la matrice di elementi avrà 10.000 colonne.

items

#recsystems

In un sistema di suggerimenti, le entità consigliate dal sistema. Ad esempio, i video sono gli elementi consigliati da una libreria, mentre i libri sono quelli consigliati dalla libreria.

L

fattorizzazione matrice

#recsystems

In matematica, un meccanismo per trovare le matrici il cui prodotto punto è simile a una matrice target.

Nei sistemi di consigli, la matrice target spesso contiene le valutazioni degli utenti sugli elementi. Ad esempio, la matrice di destinazione per un sistema di suggerimenti di film potrebbe avere il seguente aspetto, dove i numeri interi positivi sono valutazioni degli utenti e 0 indica che l'utente non ha valutato il film:

  Casablanca La storia di Philadelphia Black Panther Wonder Woman Pulp Fiction
Utente 1 5,0 3,0 0.0 2,0 0.0
Utente 2 4.0 0.0 0.0 1,0 5,0
Utente 3 3,0 1,0 4.0 5,0 0.0

Il sistema di consigli sui film mira a prevedere le classificazioni degli utenti per i film senza classificazione. Ad esempio, l'Utente 1 ad esempio Panda Nera?

Un approccio per i sistemi di suggerimenti consiste nell'utilizzare la fattorizzazione a matrice per generare le seguenti due matrici:

  • Una matrice utente, definita come il numero di utenti, X il numero di dimensioni di incorporamento.
  • Una matrice di elementi, definita come il numero di dimensioni di incorporamento e il numero di elementi.

Ad esempio, l'utilizzo della fattorizzazione della matrice sui nostri tre utenti e cinque elementi potrebbe produrre la seguente matrice utente e matrice:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Il prodotto DOT della matrice utente e della matrice dell'elemento genera una matrice di suggerimenti che contiene non solo le valutazioni degli utenti originali, ma anche le previsioni per i film che ogni utente non ha visto. Ad esempio, considera la valutazione di Casablanca da parte dell'Utente 1, pari a 5,0. Il prodotto a punti corrispondente a quella cella nella matrice dei suggerimenti dovrebbe essere circa 5.0 ed è:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Ma soprattutto, l'utente 1 apprezzerà Black Panther? Portando il prodotto del punto corrispondente alla prima riga e alla terza colonna, si ottiene una valutazione prevista di 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

In genere, la fattorizzazione della matrice produce una matrice utente e una matrice di elementi che, insieme, sono molto più compatte rispetto alla matrice target.

Dx

sistema di suggerimenti

#recsystems

Un sistema che seleziona per ciascun utente un insieme relativamente piccolo di elementi desiderabili da un corpus di grandi dimensioni. Ad esempio, un sistema di suggerimenti video potrebbe consigliare due video da un corpus di 100.000 video, selezionando Casablanca e The Philadelphia Story per un utente e Wonder Woman e Black Panther per un altro. Un sistema di suggerimenti per i video potrebbe basarsi sui consigli per fattori quali:

  • Film che utenti simili hanno valutato o guardato.
  • Genere, registi, attori, dati demografici come target...

nuovo ranking

#recsystems

La fase finale di un sistema di suggerimenti, durante la quale gli elementi con punteggio possono essere rivalutati secondo un altro algoritmo (in genere non ML). Il nuovo ranking valuta l'elenco di elementi generati dalla fase di punteggio, ad esempio:

  • Eliminare gli articoli che l'utente ha già acquistato.
  • Migliorare il punteggio degli articoli più freschi.

D

calcolo punteggio

#recsystems

La parte di un sistema di suggerimenti che fornisce un valore o un ranking per ogni articolo prodotto dalla fase di candidatura alla generazione.

U

matrice utente

#recsystems

Nei sistemi di suggerimento, un vettore di incorporamento generato dalla fattore di matrice che contiene indicatori latenti sulle preferenze dell'utente. Ogni riga della matrice utente contiene informazioni sulla potenza relativa di vari indicatori latenti per un singolo utente. Prendi ad esempio un sistema di consigli per film. In questo sistema, gli indicatori latenti nella matrice utente possono rappresentare l'interesse di ciascun utente in determinati generi o essere più difficili da interpretare, che coinvolge interazioni complesse tra più fattori.

La matrice utente ha una colonna per ogni caratteristica latente e una riga per ogni utente. In altre parole, la matrice utente ha lo stesso numero di righe della matrice di destinazione che viene fattorizzata. Ad esempio, dato un sistema di suggerimenti di film per 1.000.000 utenti, la matrice utente avrà 1.000.000 righe.

W

Squadre alternate ponderate (WALS)

#recsystems

Un algoritmo per ridurre al minimo la funzione oggettiva durante la fattorizzazione della matrice nei sistemi di suggerimento, che consente una sottoponderazione degli esempi mancanti. WALS riduce al minimo l'errore al quadrato ponderato tra la matrice originale e la ricostruzione alternando la correzione dei fattorizzazione delle righe e delle colonne. Ognuna di queste ottimizzazioni può essere risolta con meno quadrati di ottimizzazione convessa. Per maggiori dettagli, consulta il Corso sui sistemi di suggerimenti.