Dopo la generazione dei candidati, un altro modello assegna un punteggio e un ranking candidati per selezionare l'insieme di elementi da visualizzare. Il sistema di consigli potrebbero avere più generatori candidati che utilizzano origini diverse, come segue:
- Elementi correlati di un modello di fattorizzazione matriciale.
- Funzionalità utente che tengono conto della personalizzazione.
- "Locale" e "distanza" items; cioè prendere informazioni geografiche in considerazione.
- Articoli popolari o di tendenza.
- un grafo sociale; ovvero elementi contrassegnati come "Mi piace" o consigliati amici.
Il sistema combina queste diverse origini in un pool comune di candidati a cui viene assegnato un punteggio da un singolo modello e che vengono classificati in base il punteggio. Ad esempio, il sistema può addestrare un modello per prevedere la probabilità che un utente guardi un video su YouTube dato quanto segue:
- Funzionalità delle query (ad es. cronologia delle visualizzazioni dell'utente, lingua, paese, ora)
- Caratteristiche video (ad es. titolo, tag, incorporamento dei video)
Il sistema può quindi classificare i video nel pool di candidati in base alla previsione del modello.
Perché non lasciare che il generatore di candidati punti a un punteggio?
Poiché i generatori di candidati calcolano un punteggio (ad esempio, la misura di somiglianza) nello spazio di incorporamento), potresti avere la tentazione di utilizzarli per classificare beh. Tuttavia, ti consigliamo di evitare questa pratica per i seguenti motivi:
- Alcuni sistemi si basano su più generatori di candidati. I punteggi di queste generatori diversi potrebbero non essere confrontabili.
- Con un pool di candidati più ridotto, il sistema può permettersi di utilizzare più caratteristiche e un modello più complesso che può acquisire meglio il contesto.
Scelta di una funzione obiettivo per la valutazione
Come forse ricorderai da Introduction to ML Problem" Inquadratura, Il ML può agire come un genio dispettoso: non vedo l'ora di apprendere l'obiettivo che fornisci, ma devi fare attenzione a ciò che desideri. Questo dispettoso la qualità si applica anche ai sistemi di consigli. La scelta del punteggio funzione può influire notevolmente sul ranking degli elementi e, in ultima analisi, la qualità dei consigli.
Esempio:
Fai clic sulle icone Più per scoprire cosa succede all'uso di ogni obiettivo.
Bias di posizionamento nel punteggio
Gli elementi che appaiono più in basso sullo schermo hanno meno probabilità di ricevere clic rispetto a gli elementi visualizzati più in alto sullo schermo. Tuttavia, quando valuti i punteggi, i di solito il sistema non sa in che parte dello schermo un link al video alla fine. È necessario eseguire anche query sul modello con tutte le posizioni possibili costoso. Anche se fosse possibile eseguire query su più posizioni, il sistema potrebbero comunque non trovare un ranking coerente tra più punteggi.
Soluzioni
- Crea classifiche indipendenti dalla posizione.
- Classifica tutti i candidati come se fossero in prima posizione sullo schermo.