Vantaggi dei filtri collaborativi e svantaggi

Vantaggi

Non è richiesta alcuna conoscenza del dominio

Non abbiamo bisogno di conoscere il dominio perché gli incorporamenti vengono appresi automaticamente.

Serendipità

Il modello può aiutare gli utenti a scoprire nuovi interessi. Il sistema di machine learning potrebbe non sapere se l'utente è interessato a un determinato articolo, ma il modello potrebbe comunque consigliarlo perché utenti simili sono interessati all'elemento.

Un ottimo punto di partenza

In una certa misura, il sistema ha bisogno solo della matrice di feedback per addestrare un modello di fattorizzazione della matrice. In particolare, il sistema non ha bisogno di funzionalità contestuali. In pratica, questa strategia può essere utilizzata come uno dei vari generatori candidati.

Svantaggi

Impossibile gestire gli elementi aggiornati

La previsione del modello per una determinata coppia (utente, articolo) è il prodotto punto degli incorporamenti corrispondenti. Quindi, se un elemento non viene visualizzato durante l'addestramento, il sistema non può creare un incorporamento e non eseguire query sul modello con questo elemento. Questo problema è spesso chiamato problema di avvio a freddo. Tuttavia, le seguenti tecniche possono risolvere il problema dell'avvio a freddo in una certa misura:

  • Proiezione in WALS. Dato che un elemento non è presente \(i_0\) nell'addestramento, se il sistema ha alcune interazioni con gli utenti, può calcolare facilmente un incorporamento \(v_{i_0}\) per questo elemento senza dover reimpostare l'intero modello. Il sistema deve risolvere semplicemente la seguente equazione o la versione ponderata:

    \[\min_{v_{i_0} \in \mathbb R^d} \|A_{i_0} - U v_{i_0}\|\]

    L'equazione precedente corrisponde a un'iterazione in WALS: gli incorporamenti degli utenti vengono mantenuti fissi e il sistema risolve l'incorporamento dell'elemento \(i_0\). La stessa operazione può essere eseguita per un nuovo utente.

  • Euristica per generare incorporamenti di elementi nuovi. Se il sistema non ha interazioni, il sistema può approssimarne la media calcolando la media degli incorporamenti degli elementi della stessa categoria, dallo stesso caricatore (su YouTube) e così via.

Difficoltà a includere le funzionalità secondarie per la query/l'elemento

Le funzionalità laterali sono quelle che esulano dall'ID query o elemento. Per i consigli sui film, gli elementi secondari potrebbero includere paese o età. L'inclusione delle funzionalità laterali disponibili migliora la qualità del modello. Sebbene l'inclusione delle funzionalità collaterali nelle WALS potrebbe non essere facile, una generalizzazione di WALS rende tutto questo possibile.

Per generalizzare i WALS, aumenta la matrice di input con le funzionalità definendo una matrice di blocco \(\bar A\), dove:

  • Il blocco (0, 0) è la matrice di feedback originale \(A\).
  • Blocca (0, 1) è una codifica multi-hot delle funzionalità utente.
  • Il blocco (1, 0) è una codifica multi-hot delle funzionalità dell'elemento.