Récupération

Supposons que vous ayez un modèle de représentation vectorielle continue. Pour un utilisateur donné, comment feriez-vous quels articles recommander ?

Au moment de la présentation des résultats, pour une requête donnée, vous commencez par effectuer l'une des opérations suivantes:

  • Pour un modèle de factorisation matricielle, la représentation vectorielle continue de la requête (ou de l'utilisateur) est connue de manière statique. Le système peut alors effectuer une recherche la matrice de représentation vectorielle continue des utilisateurs.
  • Pour un modèle DNN, le système calcule la représentation vectorielle continue de la requête. \(\psi(x)\) lors de la diffusion en exécutant le réseau sur le vecteur de caractéristiques \(x\).

Après avoir obtenu la représentation vectorielle continue de la requête \(q\), recherchez les représentations vectorielles continues d'éléments \(V_j\) proches de \(q\) dans l'espace de représentation vectorielle. Il s'agit d'un problème du voisin le plus proche. Par exemple, vous pouvez renvoyer les k premières éléments en fonction du score de similarité \(s(q, V_j)\).

Image d'un spectre bidimensionnel avec plusieurs films et utilisateurs organisés
films pour enfants, films pour adultes, art et essai ou superproductions. Un utilisateur est
en surbrillance, ainsi que
deux films à proximité.

Vous pouvez utiliser une approche similaire pour les recommandations d'éléments associés. Par exemple, Lorsque l'utilisateur regarde une vidéo YouTube, le système peut d'abord rechercher la de cet élément, puis recherchez celles d'autres éléments \(V_j\) qui sont proches dans l'espace de représentation vectorielle continue.

Récupération à grande échelle

Pour calculer les voisins les plus proches dans l'espace de représentation vectorielle, le système une évaluation exhaustive de tous les candidats potentiels. Évaluation exhaustive peut être coûteux pour les corpus très grands, mais vous pouvez utiliser les stratégies suivantes pour le rendre plus efficace:

  • Si la représentation vectorielle continue de la requête est connue de manière statique, le système peut effectuer de scores exhaustifs hors connexion, le précalcul et le stockage d'une liste des les meilleurs candidats pour chaque requête. Il s'agit d'une pratique courante recommandation d'article associé.
  • Utiliser les voisins les plus proches.