Représentations vectorielles continues: motivation à partir d'un filtrage collaboratif

Le filtrage collaboratif consiste à prédire les centres d'intérêt d'un utilisateur en fonction de ceux de nombreux autres utilisateurs. Par exemple, prenons la tâche de recommandation de films. Supposons que nous ayons 500 000 utilisateurs et une liste des films que chaque utilisateur a regardés (à partir d'un catalogue de 1 000 000 films). Notre objectif est de recommander des films aux utilisateurs.

Pour résoudre ce problème, une méthode est nécessaire pour déterminer les films similaires. Nous pouvons atteindre cet objectif en intégrant les films dans un espace de petite dimension créé à proximité de films similaires.

Avant d'aborder l'apprentissage des représentations vectorielles continues, nous devons d'abord déterminer le type de qualités qu'elles doivent avoir et la représentation des données d'entraînement.

Disposer les films sur une ligne de nombres en une dimension

Pour développer une intuition basée sur les représentations vectorielles continues, sur une feuille de papier, essayez d'organiser les films suivants sur une ligne numérique unidimensionnelle afin que les films les plus proches les uns des autres soient les plus proches:

Film Rating Description
Bleu D Une veuve française pleure la perte de son mari et de sa fille après qu'ils ont péri dans un accident de voiture.
The Dark Knight Rises PG-13 Batman cherche à sauver la destruction nucléaire de Gotham City dans cette suite de The Dark Knight, qui se déroule dans l'univers DC Comics.
Harry Potter à l'école des sorciers PG Un orphelin découvre qu'il est sorcier et s'inscrit à l'école de sorcellerie et de sorcellerie de Poudlard. Il mène sa première bataille contre le maléfique Lord Voldemort.
Les Indestructibles PG Une famille de super-héros contraints de civils quitte la retraite pour sauver la course des super-héros de Syndrome et de son meurtrier robot.
Shrek PG Un adorable ogre et son acolyte se lancent dans la mission de sauver la princesse Fiona, qui est emprisonnée dans son château par un dragon.
Star Wars PG Luke Skywalker et Han Solo font équipe avec deux Android pour sauver la princesse Leia et la galaxie.
Les Triplettes de Belleville PG-13 Lorsque Champion, un cycliste professionnel, est enlevé lors du Tour de France, sa grand-mère et un chien en surpoids voyagent à l'étranger pour le sauver, avec l'aide d'un trio de chanteurs de jazz âgés.
Mémo D Un amnésique cherche désespérément à résoudre le meurtre de sa femme en tatouant des indices sur son corps.

Disposer des films dans un espace à deux dimensions

Essayez le même exercice qu'avant, mais cette fois, organisez les mêmes films dans un espace à deux dimensions.