Vantaggi
Non è necessaria alcuna conoscenza settoriale
Non abbiamo bisogno della conoscenza del dominio perché gli incorporamenti vengono appresi automaticamente.Serendipity
Il modello può aiutare gli utenti a scoprire nuovi interessi. Da solo, il sistema di ML può non sa che l'utente è interessato a un determinato articolo, ma il modello potrebbe comunque lo consiglia perché utenti simili sono interessati all'articolo.Ottimo punto di partenza
In una certa misura, il sistema ha bisogno solo della matrice di feedback per addestrare una matrice di fattorizzazione. In particolare, il sistema non ha bisogno di funzionalità contestuali. In pratica, può essere utilizzato come uno dei vari generatori di candidati.
Svantaggi
Impossibile gestire elementi aggiornati
La previsione del modello per una determinata coppia (utente, elemento) è il punto del prodotto degli incorporamenti corrispondenti. Quindi, se un elemento non viene visto durante l'addestramento, il sistema non può creare un incorporamento query sul modello con questo elemento. Questo problema viene spesso chiamato problema di avvio a freddo. Tuttavia, le seguenti tecniche possono risolvere il problema dell'avvio a freddo in una certa misura:
Proiezione in WALS. Dato un nuovo elemento \(i_0\) non visto nell'addestramento, Se il sistema ha poche interazioni con gli utenti, può calcolare facilmente un incorporamento \(v_{i_0}\) per questo elemento senza dover per riaddestrare l'intero modello. Il sistema deve semplicemente risolvere o la versione ponderata:
\[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]
L'equazione precedente corrisponde a un'iterazione in WALS: gli incorporamenti utente vengono mantenuti fissi e il sistema risolve dell'elemento \(i_0\). La stessa operazione può essere eseguita per un nuovo utente.
Euristica per generare incorporamenti di elementi aggiornati. Se il sistema non ha interazioni, il sistema può approssimare la sua incorporamento calcolando la media degli incorporamenti di elementi della stessa categoria, stesso utente che ha caricato il video (su YouTube) e così via.
Difficoltà di inclusione delle caratteristiche collaterali per la query/l'elemento
Le caratteristiche collaterali sono tutte le caratteristiche oltre l'ID query o elemento. Per film consigliati, le funzionalità secondarie possono includere il paese o l'età. Tra cui: le caratteristiche collaterali disponibili migliorano la qualità del modello. Sebbene potrebbe non essere facile includere caratteristiche collaterali in WALS, una generalizzazione di WALS lo rende possibile.
Per generalizzare il codice WALS, aumenta la matrice di input con caratteristiche definendo un a blocchi \(\bar A\), dove:
- Il blocco (0, 0) è la matrice del feedback originale \(A\).
- Il blocco (0, 1) è una codifica multi-hot delle caratteristiche utente.
- Il blocco (1, 0) è una codifica multi-hot delle caratteristiche dell'elemento.