Le filtrage collaboratif consiste à prédire les centres d'intérêt d'un utilisateur en fonction de ceux de nombreux autres utilisateurs. Par exemple, prenons la tâche de recommandation de films. Supposons que nous ayons 500 000 utilisateurs et une liste des films que chaque utilisateur a regardés (à partir d'un catalogue de 1 000 000 films). Notre objectif est de recommander des films aux utilisateurs.
Pour résoudre ce problème, une méthode est nécessaire pour déterminer les films similaires. Nous pouvons atteindre cet objectif en intégrant les films dans un espace de petite dimension créé à proximité de films similaires.
Avant d'aborder l'apprentissage des représentations vectorielles continues, nous devons d'abord déterminer le type de qualités qu'elles doivent avoir et la représentation des données d'entraînement.
Disposer les films sur une ligne de nombres en une dimension
Pour développer une intuition basée sur les représentations vectorielles continues, sur une feuille de papier, essayez d'organiser les films suivants sur une ligne numérique unidimensionnelle afin que les films les plus proches les uns des autres soient les plus proches:
Film | Rating | Description |
---|---|---|
Bleu | D | Une veuve française pleure la perte de son mari et de sa fille après qu'ils ont péri dans un accident de voiture. |
The Dark Knight Rises | PG-13 | Batman cherche à sauver la destruction nucléaire de Gotham City dans cette suite de The Dark Knight, qui se déroule dans l'univers DC Comics. |
Harry Potter à l'école des sorciers | PG | Un orphelin découvre qu'il est sorcier et s'inscrit à l'école de sorcellerie et de sorcellerie de Poudlard. Il mène sa première bataille contre le maléfique Lord Voldemort. |
Les Indestructibles | PG | Une famille de super-héros contraints de civils quitte la retraite pour sauver la course des super-héros de Syndrome et de son meurtrier robot. |
Shrek | PG | Un adorable ogre et son acolyte se lancent dans la mission de sauver la princesse Fiona, qui est emprisonnée dans son château par un dragon. |
Star Wars | PG | Luke Skywalker et Han Solo font équipe avec deux Android pour sauver la princesse Leia et la galaxie. |
Les Triplettes de Belleville | PG-13 | Lorsque Champion, un cycliste professionnel, est enlevé lors du Tour de France, sa grand-mère et un chien en surpoids voyagent à l'étranger pour le sauver, avec l'aide d'un trio de chanteurs de jazz âgés. |
Mémo | D | Un amnésique cherche désespérément à résoudre le meurtre de sa femme en tatouant des indices sur son corps. |
Disposer des films dans un espace à deux dimensions
Essayez le même exercice qu'avant, mais cette fois, organisez les mêmes films dans un espace à deux dimensions.