Glossario del machine learning: sistemi dei consigli

Questa pagina contiene i termini del glossario dei sistemi di consigli. Per tutti i termini del glossario, fai clic qui.

C

generazione di candidati

#recsystems

L'insieme iniziale di consigli scelti da un sistema di consigli. Ad esempio, considera una libreria che offre 100.000 titoli. La fase di generazione dei candidati crea un elenco molto più piccolo di libri adatti per un determinato utente, ad esempio 500. Tuttavia, anche 500 libri sono troppi da consigliare a un utente. Le fasi successive e più costose di un sistema di consigli (come l'assegnazione del punteggio e il nuovo ranking) riducono questi 500 a un insieme molto più piccolo e utile di consigli.

Per ulteriori informazioni, consulta la Panoramica della generazione di candidati nel corso sui sistemi di raccomandazione.

filtro collaborativo

#recsystems

Effettuare previsioni sugli interessi di un utente in base agli interessi di molti altri utenti. Il filtraggio collaborativo viene spesso utilizzato nei sistemi di consigli.

Per ulteriori informazioni, consulta la sezione Filtro collaborativo nel corso sui sistemi di raccomandazione.

I

matrice di elementi

#recsystems

Nei sistemi di consigli, una matrice di vettori di incorporamento generata dalla fattorizzazione matriciale che contiene indicatori latenti su ogni elemento. Ogni riga della matrice degli articoli contiene il valore di una singola caratteristica latente per tutti gli articoli. Ad esempio, prendi in considerazione un sistema di consigli sui film. Ogni colonna nella matrice di elementi rappresenta un singolo film. Gli indicatori latenti possono rappresentare generi o essere indicatori più difficili da interpretare che coinvolgono interazioni complesse tra genere, star, età del film o altri fattori.

La matrice degli elementi ha lo stesso numero di colonne della matrice di destinazione che viene fattorizzata. Ad esempio, dato un sistema di consigli per i film che valuta 10.000 titoli di film, la matrice degli elementi avrà 10.000 colonne.

elementi

#recsystems

In un sistema di consigli, le entità consigliate da un sistema. Ad esempio, i video sono gli articoli consigliati da un negozio di video, mentre i libri sono gli articoli consigliati da una libreria.

M

fattorizzazione matriciale

#recsystems

In matematica, un meccanismo per trovare le matrici il cui prodotto scalare approssima una matrice di destinazione.

Nei sistemi di consigli, la matrice di destinazione spesso contiene le valutazioni degli utenti relative agli elementi. Ad esempio, la matrice di destinazione per un sistema di consigli sui film potrebbe essere simile alla seguente, dove gli interi positivi sono le valutazioni degli utenti e 0 significa che l'utente non ha valutato il film:

  Casablanca La storia di Filadelfia Black Panther Wonder Woman Pulp Fiction
Utente 1 5,0 3,0 0.0 2.0 0.0
Utente 2 4.0 0.0 0.0 1.0 5,0
Utente 3 3,0 1.0 4.0 5,0 0.0

Lo scopo del sistema di consigli sui film è prevedere le valutazioni degli utenti per i film senza classificazione. Ad esempio, all'utente 1 piacerà Black Panther?

Un approccio per i sistemi di suggerimenti è utilizzare la fattorizzazione matriciale per generare le seguenti due matrici:

  • Una matrice utente, formata dal numero di utenti x il numero di dimensioni di embedding.
  • Una matrice di elementi, formata dal numero di dimensioni di embedding x il numero di elementi.

Ad esempio, l'utilizzo della fattorizzazione matriciale sui tre utenti e sui cinque articoli potrebbe generare le seguenti matrici utente e di articolo:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Il prodotto scalare della matrice utente e della matrice elemento genera una matrice di consigli che contiene non solo le valutazioni originali degli utenti, ma anche le previsioni per i film che ciascun utente non ha visto. Ad esempio, prendi in considerazione la valutazione dell'utente 1 per Casablanca, pari a 5,0. Il prodotto punto corrispondente a quella cella nella matrice di consigli dovrebbe essere di circa 5, 0 e in effetti è:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Ancora più importante, all'utente 1 piacerà Black Panther? Il prodotto scalare corrispondente alla prima riga e alla terza colonna genera una valutazione prevista di 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La fattorizzazione matriciale genera in genere una matrice utente e una matrice elemento che, insieme, sono molto più compatte della matrice target.

R

sistema di suggerimenti

#recsystems

Un sistema che seleziona per ogni utente un insieme relativamente piccolo di elementi desiderabili da un corpus di grandi dimensioni. Ad esempio, un sistema di consigli sui video potrebbe consigliare due video da un corpus di 100.000 video, selezionando Casablanca e La storia di Filadelfia per un utente e Wonder Woman e Black Panther per un altro. Un sistema di consigli sui video potrebbe basare i suoi consigli su fattori quali:

  • Film valutati o guardati da utenti simili.
  • Genere, registi, attori, gruppo demografico di destinazione…

nuovo ranking

#recsystems

La fase finale di un sistema di consigli, durante la quale gli elementi valutati possono essere rivalutati in base a un altro algoritmo (in genere non di ML). Il ricoinvolgimento valuta l'elenco di elementi generato dalla fase di assegnazione del punteggio, adottando azioni quali:

  • Eliminazione di articoli già acquistati dall'utente.
  • Aumentare il punteggio degli elementi più recenti.

S

calcolo punteggio

#recsystems

La parte di un sistema di consigli che fornisce un valore o un ranking per ogni elemento prodotto dalla fase di generazione di candidati.

U

matrice di utenti

#recsystems

Nei sistemi di suggerimenti, un vettore di embedding generato dalla fattorizzazzione matriciale che contiene indicatori latenti sulle preferenze degli utenti. Ogni riga della matrice utente contiene informazioni sull'intensità relativa di vari indicatori latenti per un singolo utente. Ad esempio, prendi in considerazione un sistema di consigli sui film. In questo sistema, gli indicatori latenti nella matrice utente potrebbero rappresentare l'interesse di ciascun utente per generi specifici oppure potrebbero essere indicatori più difficili da interpretare che coinvolgono interazioni complesse in più fattori.

La matrice utente ha una colonna per ogni caratteristica latente e una riga per ogni utente. In altre parole, la matrice utente ha lo stesso numero di righe della matrice target che viene fattorizzata. Ad esempio, dato un sistema di consigli sui film per 1.000.000 di utenti, la matrice degli utenti avrà 1.000.000 di righe.

M

Minimi quadrati alternati ponderati (WALS)

#recsystems

Un algoritmo per ridurre al minimo la funzione obiettivo durante la fattorizzazzione matriciale nei sistemi di suggerimenti, che consente di ridurre il peso degli esempi mancanti. WALS minimizza l'errore quadratico ponderato tra la matrice originale e la ricostruzione alternando la correzione della fattorizzazione delle righe e della fattorizzazione delle colonne. Ognuna di queste ottimizzazioni può essere risolta mediante la regressione lineare otimizzazione convessa. Per maggiori dettagli, consulta il corso sui sistemi di raccomandazione.