Glossaire du machine learning: systèmes de recommandation

Cette page contient des termes du glossaire des systèmes de recommandation. Pour tous les termes du glossaire, cliquez ici.

C

génération de candidats

#recsystems

Il s'agit de l'ensemble initial de recommandations choisi système de recommandation. Prenons l'exemple d'une proposant 100 000 titres. La phase de génération de candidats crée une liste bien plus petite de livres adaptés à un utilisateur particulier, disons 500. Mais même 500 livres, c'est bien trop à recommander à un utilisateur. Par la suite, plus cher, d'un système de recommandation (comme l'attribution de scores et reclassement) les réduit de façon significative, un ensemble de recommandations plus utile.

filtrage collaboratif

#recsystems

Effectuer des prédictions sur les centres d'intérêt d'un utilisateur en fonction des intérêts de nombreux autres utilisateurs. Filtrage collaboratif est souvent utilisée dans les systèmes de recommandation.

I

matrice des éléments

#recsystems

Dans les systèmes de recommandation, une matrice des vecteurs de représentation vectorielle continue générés par factorisation matricielle contenant les signaux latents pour chaque élément. Chaque ligne de la matrice éléments contient la valeur d'une seule ligne latente pour tous les articles. Prenons l'exemple d'un système de recommandation de films. Chaque colonne dans la matrice éléments représente un seul film. Les signaux latents peuvent représenter des genres ou être plus difficiles à interpréter des signaux qui impliquent des interactions complexes entre les genres, les stars l'âge du film ou d'autres facteurs.

La matrice éléments a le même nombre de colonnes que la cible de la matrice qui est factorisée. Par exemple, pour un film de recommandation évaluant 10 000 titres de films, la matrice des éléments comporte 10 000 colonnes.

articles

#recsystems

Dans un système de recommandation, les entités qu'un système recommande. Par exemple, les vidéos sont les éléments recommande, tandis que les livres sont les articles qu’une librairie recommande.

M

factorisation matricielle

#recsystems

En mathématiques, un mécanisme permettant de trouver les matrices dont le produit scalaire se rapproche d'une la matrice cible.

Dans les systèmes de recommandation, la matrice cible retient souvent les données avis sur des articles Par exemple, la cible pour un système de recommandation de films peut ressembler suivantes, où les entiers positifs correspondent aux notes des utilisateurs et à 0 signifie que l'utilisateur n'a pas évalué le film:

  Casablanca Philadelphia Story Black Panther Wonder Woman Pulp Fiction
Utilisateur 1 5.0 3,0 0,0 2.0 0,0
Utilisateur 2 4.0 0,0 0,0 1.0 5.0
Utilisateur 3 3,0 1.0 4.0 5,0 0,0

Le système de recommandation de films vise à prédire les notes des utilisateurs pour films non évalués. Par exemple, l'utilisateur 1 va-t-il aimer Black Panther ?

Une approche pour les systèmes de recommandation consiste à utiliser une matrice factorisation pour générer les deux matrices suivantes:

  • Une matrice des utilisateurs, définie sous la forme nombre d'utilisateurs X que le nombre de dimensions de la représentation vectorielle continue.
  • Une matrice éléments, définie comme le nombre de représentations vectorielles continues (dimensions X) le nombre d'éléments.

Par exemple, en utilisant la factorisation matricielle sur nos trois utilisateurs et cinq éléments pourrait donner la matrice utilisateurs et la matrice éléments suivantes:

User Matrix                 Item Matrix

1.1   2.3           0.9   0.2   1.4    2.0   1.2
0.6   2.0           1.7   1.2   1.2   -0.1   2.1
2.5   0.5

Le produit scalaire de la matrice utilisateurs et de la matrice éléments donne une recommandation qui contient non seulement les notes d'origine des utilisateurs, mais aussi les prédictions pour les films que les utilisateurs n'ont pas encore vus. Prenons par exemple la note de l'utilisateur 1 pour Casablanca, qui était de 5, 0. Le point produit correspondant à cette cellule dans la matrice de recommandations doit qui devrait être d'environ 5.0, et c'est:

(1.1 * 0.9) + (2.3 * 1.7) = 4.9

Plus important encore, l'utilisateur 1 va-t-il aimer Black Panther ? Prendre le produit scalaire correspondant à la première ligne et à la troisième colonne, vous obtenez une note de 4,3:

(1.1 * 1.4) + (2.3 * 1.2) = 4.3

La factorisation matricielle donne généralement une matrice utilisateur et une matrice éléments qui, ensemble, sont nettement plus compactes que la matrice cible.

R

système de recommandation

#recsystems

Un système qui sélectionne pour chaque utilisateur un ensemble relativement petit d'éléments souhaitables éléments d'un vaste corpus. Par exemple, un système de recommandation de vidéos peut recommander à partir d'un corpus de 100 000 vidéos,en sélectionnant Casablanca, puis The Philadelphia Story (The Philadelphia Story) pour un utilisateur, et Wonder Woman et Black Panther pour une autre. Un système de recommandation de vidéos peut baser ses recommandations sur des facteurs tels que:

  • Films notés ou regardés par des utilisateurs similaires
  • Genre, réalisateurs, acteurs, catégorie démographique ciblée...

reclassement

#recsystems

La dernière étape d'un système de recommandation, au cours de laquelle les éléments notés peuvent être réévalués en fonction d'autres (généralement non ML). Le reclassement évalue la liste des éléments générées par la phase d'attribution de scores, en prenant des mesures telles que:

  • Éliminer les articles que l'utilisateur a déjà achetés.
  • Booster le score des éléments les plus récents.

S

notation

#recsystems

La partie d'un système de recommandation qui fournit une valeur ou un classement pour chaque élément produit par génération de candidats.

U

matrice utilisateurs

#recsystems

Dans les systèmes de recommandation, une vecteur de représentation vectorielle continue généré par factorisation matricielle contenant des signaux latents sur les préférences des utilisateurs. Chaque ligne de la matrice utilisateurs contient des informations sur les l'intensité de divers signaux latents pour un même utilisateur. Prenons l'exemple d'un système de recommandation de films. Dans ce système, les signaux latents dans la matrice utilisateurs peuvent représenter les intérêts de chaque utilisateur en particulier, ou il peut s'agir de signaux plus difficiles à interpréter qui impliquent des interactions complexes selon plusieurs facteurs.

La matrice utilisateurs comporte une colonne pour chaque caractéristique latente et une ligne pour chaque utilisateur. C'est-à-dire que la matrice utilisateurs a le même nombre de lignes que la cible de la matrice qui est factorisée. Par exemple, pour un film système de recommandation de 1 000 000 d'utilisateurs, la matrice utilisateurs contiendra 1 000 000 de lignes.

W

moindres carrés alternés pondérés (WALS)

#recsystems

Algorithme qui permet de minimiser la fonction objectif pendant la factorisation matricielle dans grâce aux systèmes de recommandation, les exemples manquants. La méthode WALS minimise la valeur l'erreur quadratique entre la matrice d'origine et la reconstruction en alternant la correction de la factorisation des lignes et celle des colonnes. Chacune de ces optimisations peut être résolue par les moindres carrés optimisation convexe. Pour en savoir plus, consultez les Recommendation Systems (Systèmes de recommandation).