Cette page contient les termes du glossaire des systèmes de recommandation. Pour connaître tous les termes du glossaire, cliquez ici.
C
génération de candidats
Ensemble initial de recommandations sélectionné par un système de recommandation. Prenons l'exemple d'une librairie proposant 100 000 livres. La phase de génération de candidats crée une liste beaucoup plus restreinte de livres pertinents pour un utilisateur particulier, par exemple 500. Mais recommander 500 livres à un utilisateur reste beaucoup trop. Les phases ultérieures, plus coûteuses, d'un système de recommandation (telles que l'évaluation et le reclassement) réduisent ces 500 recommandations à un ensemble beaucoup plus petit et plus utile.
Pour en savoir plus, consultez la section Présentation de la génération de candidats dans le cours sur les systèmes de recommandation.
filtrage collaboratif
Prédictions sur les centres d'intérêt d'un utilisateur en fonction de ceux de nombreux autres utilisateurs. Le filtrage collaboratif est souvent utilisé dans les systèmes de recommandation.
Pour en savoir plus, consultez la section Filtrage collaboratif du cours sur les systèmes de recommandation.
I
matrice éléments
Dans les systèmes de recommandation, matrice de vecteurs d'embedding générés par la factorisation matricielle, qui contient des signaux latents sur chaque élément. Chaque ligne de la matrice éléments contient la valeur d'une seule caractéristique latente pour tous les éléments. Prenons l'exemple d'un système de recommandation de films. Chaque colonne de la matrice éléments représente un seul film. Les signaux latents peuvent représenter des genres ou être des signaux plus difficiles à interpréter impliquant des interactions complexes entre des facteurs comme le genre, la note ou l'ancienneté du film.
La matrice éléments a le même nombre de colonnes que la matrice cible qui est factorisée. Par exemple, dans le cas d'un système de recommandation de films évaluant 10 000 titres de films, la matrice éléments comportera 10 000 colonnes.
éléments
Dans un système de recommandation, les entités recommandées par un système. Par exemple, les vidéos sont les éléments recommandés par un vidéo club, alors que les livres sont les éléments recommandés par une librairie.
M
factorisation matricielle
En mathématiques, mécanisme pour trouver les matrices dont le produit scalaire se rapproche d'une matrice cible.
Dans les systèmes de recommandation, la matrice cible contient souvent les notes des utilisateurs sur les éléments. Par exemple, la matrice cible d'un système de recommandation de films peut ressembler au tableau ci-dessous, où les entiers positifs sont les notes des utilisateurs et où zéro signifie que l'utilisateur n'a pas évalué le film:
Casablanca | Indiscrétions | Black Panther | Wonder Woman | Pulp Fiction | |
---|---|---|---|---|---|
Utilisateur 1 | 5.0 | 3,0 | 0,0 | 2.0 | 0,0 |
Utilisateur 2 | 4.0 | 0,0 | 0,0 | 1.0 | 5.0 |
Utilisateur 3 | 3,0 | 1.0 | 4.0 | 5,0 | 0,0 |
Le système de recommandation de films vise à prédire les notes des utilisateurs pour les films non évalués. Par exemple, l'utilisateur 1 va-t-il aimer Black Panther ?
Une approche pour les systèmes de recommandation consiste à utiliser la factorisation matricielle afin de générer les deux matrices suivantes:
- Une matrice utilisateurs, définie sous la forme nombre d'utilisateurs X nombre de dimensions de la représentation vectorielle.
- Une matrice éléments, définie sous la forme nombre de dimensions de la représentation vectorielle X nombre d'éléments.
Par exemple, utiliser la factorisation matricielle sur nos trois utilisateurs et cinq éléments pourrait générer les matrices utilisateurs et les matrices éléments suivantes:
User Matrix Item Matrix 1.1 2.3 0.9 0.2 1.4 2.0 1.2 0.6 2.0 1.7 1.2 1.2 -0.1 2.1 2.5 0.5
Le produit scalaire de la matrice utilisateurs et de la matrice éléments génère une matrice de recommandations qui contient non seulement les notes originales des utilisateurs, mais également des prédictions pour les films que chaque utilisateur n'a pas vu. Prenons par exemple la note de l'utilisateur 1 pour Casablanca, qui était de 5, 0. Le produit scalaire correspondant à cette cellule dans la matrice de recommandations devrait normalement se situer autour de 5,0, et c'est bien le cas:
(1.1 * 0.9) + (2.3 * 1.7) = 4.9
Plus important encore, l'utilisateur 1 va-t-il aimer Black Panther ? En prenant le produit scalaire correspondant à la première ligne et à la troisième colonne, on obtient une note de 4,3:
(1.1 * 1.4) + (2.3 * 1.2) = 4.3
La factorisation matricielle produit généralement une matrice utilisateurs et une matrice éléments qui, ensemble, sont nettement plus compactes que la matrice cible.
R
système de recommandation
Système qui sélectionne pour chaque utilisateur un ensemble relativement petit d'éléments souhaitables dans un corpus volumineux. Par exemple, un système de recommandation de vidéos peut recommander deux vidéos d'un corpus de 100 000 vidéos, en sélectionnant Casablanca et Indiscrétions pour un utilisateur et Wonder Woman et Black Panther pour un autre. Un système de recommandation de vidéos pourrait baser ses recommandations sur la base de facteurs tels que:
- Des films notés ou vus par des utilisateurs similaires ;
- Le genre, les réalisateurs, les acteurs, la cible démographique, etc.
Pour en savoir plus, consultez le cours sur les systèmes de recommandation.
reclassement
Étape finale d'un système de recommandation au cours duquel les éléments notés peuvent être réévalués selon un autre algorithme (généralement non issu du machine learning). Le reclassement évalue la liste des éléments générés par la phase d'attribution de scores, en prenant des mesures telles que:
- Éliminer les éléments que l'utilisateur a déjà achetés.
- Booster le score des éléments plus récents.
Pour en savoir plus, consultez la section Ré-ordonnancement du cours sur les systèmes de recommandation.
S
notation
Partie d'un système de recommandation qui fournit une valeur ou un classement pour chaque élément produit par la phase de génération de candidats.
U
matrice utilisateurs
Dans les systèmes de recommandation, vecteur d'encapsulation généré par la factorisation matricielle qui contient des signaux latents sur les préférences utilisateur. Chaque ligne de la matrice utilisateur contient des informations sur la force relative de divers signaux latents pour un seul utilisateur. Prenons l'exemple d'un système de recommandation de films. Dans ce système, les signaux latents de la matrice utilisateurs peuvent représenter l'intérêt de chaque utilisateur pour des genres particuliers, ou bien il peut s'agir de signaux plus difficiles à interpréter impliquant des interactions complexes entre plusieurs facteurs.
La matrice utilisateurs comporte une colonne pour chaque caractéristique latente et une ligne pour chaque utilisateur. C'est-à-dire que la matrice utilisateurs a le même nombre de lignes que la matrice cible qui est factorisée. Par exemple, avec un système de recommandation de films pour 1 000 000 d'utilisateurs, la matrice utilisateurs comportera 1 000 000 lignes.
W
moindres carrés alternés pondérés (Weighted Alternating Least Squares (WALS))
Algorithme permettant de minimiser la fonction objectif lors de la factorisation matricielle dans les systèmes de recommandation, ce qui permet de sous-pondérer les exemples manquants. WALS minimise l'erreur quadratique pondérée entre la matrice d'origine et la reconstruction en corrigeant alternativement la factorisation des lignes et la factorisation des colonnes. Chacune de ces optimisations peut être résolue par l'optimisation convexe des moindres carrés. Pour en savoir plus, consultez le cours sur les systèmes de recommandation.