Présentation de la structure du GAN

Un réseau antagoniste génératif (GAN) se compose de deux parties:

  • Le générateur apprend à générer des données plausibles. Les instances générées deviennent des exemples d'entraînement négatifs pour le discriminateur.
  • Le discriminateur apprend à distinguer les données factices du générateur des données réelles. Le discriminateur pénalise le générateur pour la production de résultats invraisemblables.

Lorsque l'entraînement commence, le générateur produit des données manifestement fausses, et le discriminateur apprend rapidement à les identifier comme telles:

Trois colonnes sont intitulées "Données générées", "Discriminateur" et "Données réelles". Sous "Données générées", un rectangle bleu contient un trait sinueux et un cercle. Le rectangle est la première tentative ratée du générateur pour dessiner un billet de banque. Sous "Données réelles", vous trouverez une image d'un billet de 10 $. Sous "Discriminator" figurent les mots "FAKE" et "REAL". Une flèche pointe du mot "FAKE" vers l'image sous "Données générées". Une autre flèche pointe du mot "RÉEL" vers l'image sous "Données réelles".

À mesure que l'entraînement progresse, le générateur se rapproche de la production d'une sortie capable d'induire en erreur le discriminateur:

Cette image ajoute une ligne sous les titres "Données générées", "Discriminateur" et "Données réelles" de l'image précédente. Sous "Données générées", un rectangle vert avec le chiffre 10 en haut à gauche et un dessin simple d'un visage s'affiche. Sous "Données réelles", vous trouverez une image d'un vrai billet de 100 dollars. Sous "Discriminateur", le mot "FAKE" est associé à une flèche pointant vers l'image sous "Données générées", et le mot "REAL" est associé à une flèche pointant vers l'image sous "Données réelles".

Enfin, si l'entraînement du générateur se passe bien, le discriminateur a de plus en plus de mal à faire la différence entre le vrai et le faux. Il commence à classer les données factices comme réelles, et sa précision diminue.

Cette image ajoute une ligne sous les titres "Données générées", "Discriminateur" et "Données réelles" de la première image précédente. Sous "Données générées", vous trouverez une image d'un billet de 20 $. Sous "Données réelles", une image d'un billet de 20 $ s'affiche. Sous "Discriminateur", le mot "RÉEL" est associé à une flèche pointant vers l'image sous "Données générées", et le mot "RÉEL" est associé à une flèche pointant vers l'image sous "Données réelles".

Voici une image de l'ensemble du système:

Schéma d'un réseau antagoniste génératif. Au centre du schéma se trouve une case intitulée "discriminateur". Deux branches alimentent cette boîte depuis la gauche.  La branche supérieure commence en haut à gauche du diagramme avec un cylindre intitulé "Images du monde réel". Une flèche part de ce cylindre et rejoint un rectangle intitulé "Échantillon". Une flèche partant de la zone "Échantillon" alimente la zone "Discriminateur". La branche inférieure alimente la boîte "Discriminator" à partir d'une boîte intitulée "Random Input" (Entrée aléatoire). Une flèche relie le champ "Entrée aléatoire" à un champ intitulé "Générateur". Une flèche part de la zone "Générateur" et pointe vers une deuxième zone "Échantillon". Une flèche relie la zone "Échantillon" à la zone "Discriminateur". Sur le côté droit de la zone "Discriminateur", une flèche mène à une zone contenant un cercle vert et un cercle rouge. Le mot "Réel" s'affiche en vert au-dessus de la zone, et le mot "Faux" en rouge en dessous. Deux flèches mènent de cette zone à deux autres situées sur la droite du diagramme. Une flèche mène à un encadré intitulé "Perte de discriminant". L'autre flèche mène à un cadre intitulé "Perte de générateur".

Le générateur et le discriminateur sont tous deux des réseaux de neurones. La sortie du générateur est connectée directement à l'entrée du discriminateur. Grâce à la propagation inverse, la classification du discriminateur fournit un signal que le générateur utilise pour mettre à jour ses poids.

Voyons plus en détail les éléments de ce système.