Une nouvelle version améliorée du cours d'initiation au machine learning sera disponible en août 2024. Tenez-vous informé !

Cette page a été traduite par l'API Cloud Translation.

Représentations vectorielles continues

Une représentation vectorielle continue est un espace de relativement faible dimension dans lequel vous pouvez traduire des vecteurs de grande dimension. Les représentations vectorielles continues facilitent le machine learning sur des entrées volumineuses, telles que des vecteurs creux représentant des mots. Idéalement, une représentation vectorielle continue capture une partie de la sémantique de l'entrée en rapprochant les entrées sémantiquement similaires les unes des autres dans l'espace de représentation vectorielle. Une représentation vectorielle continue peut être apprise et réutilisée sur plusieurs modèles.

Représentations vectorielles continues

Motivation issue du filtrage collaboratif

Entrée:1 000 000 de films que 500 000 utilisateurs ont choisi de regarder
Tâche : recommander des films aux utilisateurs

Pour ce faire, nous avons besoin d'une méthode qui nous permette de déterminer les similitudes entre les films.

Organisation des films par similarité (1 j)

Liste de films classés sur une seule ligne, de gauche à droite. Commence par la gauche, Les Indestructibles, Triplettes de Belleville

Organisation de films par similarité (2d)

La même liste de films que dans la diapositive précédente, mais organisée en deux dimensions, par exemple "Shrek" se trouve à gauche et au-dessus de "Les Indestructibles".

Représentation vectorielle continue à deux dimensions

Même disposition que la dernière diapositive. "Shrek" et "Bleu" sont mis en évidence à l'aide d'exemples de coordonnées dans le plan de représentation vectorielle en 2D.

Représentations vectorielles continues à d dimensions

Partons du principe que l'intérêt des utilisateurs pour les films peut être globalement expliqué
Chaque film devient un point à d dimensions, où la valeur de la dimension d représente l'adéquation de la vidéo.
Les représentations vectorielles continues peuvent être apprises des données

Apprentissage des représentations vectorielles continues dans un réseau profond

Aucun processus d'entraînement distinct n'est nécessaire : la couche de représentations vectorielles continues n'est qu'une couche cachée avec une unité par dimension.
Les informations supervisées (par exemple, les utilisateurs ont regardé les deux mêmes films) adaptent les représentations vectorielles continues apprises pour la tâche souhaitée.
Intuitivement, les unités cachées découvrent comment organiser les éléments dans l'espace à d dimensions afin d'optimiser au mieux l'objectif final.

Représentation de l'entrée

Chaque exemple (une ligne de cette matrice) est un vecteur creux de caractéristiques (films) visionnées par l'utilisateur.
Représentation dense de cet exemple comme suit : (0, 1, 0, 1, 0, 0, 0, 1)

N'est pas efficace en termes d'espace et de temps.

Un tableau dans lequel chaque en-tête de colonne correspond à un film et chaque ligne représente un utilisateur et les films qu'il a regardés.

Représentation de l'entrée

Créez un dictionnaire mappant chaque caractéristique à un entier compris entre 0, ..., # films - 1
Représentez efficacement le vecteur creux pour décrire les films que l'utilisateur a regardés. Cela peut être représenté par :

Vecteur creux représenté sous forme de tableau, chaque colonne représentant un film et chaque ligne représentant un utilisateur. Le tableau contient les films des diagrammes précédents et est numéroté de 1 à 999999. Chaque cellule du tableau est vérifiée si un utilisateur a regardé un film.

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix d'une vente immobilière

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix de vente d'une maison (encodage de vecteurs creux mis en évidence)

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix de vente d'une maison (couche cachée de la représentation vectorielle continue en trois dimensions encadrée)

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix de vente d'une maison (caractéristiques supplémentaires des entrées de latitude et de longitude en surbrillance)

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix d'une vente immobilière (caractéristiques d'entrée alimentant plusieurs couches cachées)

Une couche de représentations vectorielles continues dans un réseau profond

Problème de régression pour prédire le prix d'une vente immobilière:

Schéma d'un réseau de neurones profond utilisé pour prédire le prix de vente d'une maison (sortie du réseau de neurones profond en surbrillance)

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour prédire des chiffres manuscrits

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour la prédiction des chiffres manuscrits (codage d'entrée d'un vecteur creux)

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour prédire des chiffres manuscrits (autres caractéristiques mises en évidence)

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour prédire des chiffres manuscrits (représentation vectorielle continue tridimensionnelle mise en surbrillance)

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour prédire des chiffres manuscrits (couches cachées en surbrillance)

Une couche de représentations vectorielles continues dans un réseau profond

Classification à classes multiples pour prédire un chiffre manuscrit:

Schéma d'un réseau de neurones profond utilisé pour la prédiction des chiffres manuscrits (couche logit mise en surbrillance)