Überblick über die GAN-Struktur

Ein generatives kontradiktorisches Netzwerk (GAN) besteht aus zwei Teilen:

  • Der Generator lernt plausible Daten. Die generierten Instanzen werden zu negativen Trainingsbeispielen für den Diskriminator.
  • Der differenzierende lernt, die falschen Daten des Generators von echten Daten zu unterscheiden. Der Diskriminator bestraft den Generator für die Erzeugung von nicht verständlichen Ergebnissen.

Zu Beginn des Trainings erzeugt der Generator offensichtlich gefälschte Daten und der Diskriminator lernt schnell, diese zu fälschen:

Drei Spalten sind mit „Gegenerierte Daten“ und „Echte Daten“ gekennzeichnet. Unter „Generierte Daten“ befindet sich ein blaues Rechteck mit einem Kreis und einem Kreis. Das Rechteck ist der erste, fehlerhafte Versuch, einen Dollarschein zu zeichnen. Unter „Real Data“ gibt es ein Bild von einer 10-Dollar-Rechnung. Unterhalb von „Discriminator“ befinden sich die Wörter FAKE&#39 und REAL'. Ein Pfeil zeigt vom Wort „FAKE“ auf das Bild unter „Generated Data“. Ein weiterer Pfeil vom Wort „REAL&;#39;“ zum Bild unter „Real Data'“

Im Laufe des Trainings nähert sich der Generator der Ausgabe, die den Diskriminator täuschen kann:

Mit diesem Bild wird eine neue Zeile unter den Überschriften &E33;, Diskriminator'Real Data' im vorherigen Bild hinzugefügt. Unter „Generierte Daten“ sehen Sie ein grünes Rechteck mit der Zahl 10 links oben und einer einfachen Zeichnung eines Gesichts. Unter „Real Data“ ist ein Bild einer echten 100-Dollar-Rechnung zu sehen. Unter „Discriminator“ befindet sich das Wort „FAKE“ mit einem Pfeil, der auf das Bild unter „&C33;Generated Data“, und einem Pfeil, der auf das Bild unter „#Real Daten“ zeigt,

Wenn das Generatortraining gut läuft, verschlechtert sich der Unterschied zwischen echten und Fälschungen. Fake-Daten werden dann als echte klassifiziert und die Genauigkeit nimmt ab.

Bei diesem Bild wird im ersten vorherigen Bild eine neue Zeile unter den Überschriften &E33; Discriminator'Echte Daten'Echte Daten' hinzugefügt. Unter „Generierte Daten“ ist ein Bild von einer 20-Dollar-Rechnung zu sehen. Unter „Echte Daten“ ist ein Bild von einer 20-Dollar-Rechnung zu sehen. Unter „Discriminator“ befindet sich das Wort „REAL“ mit einem Pfeil, der auf das Bild unter „'Generated Data“, und einem Pfeil, der auf das Bild unter „Real Data“ verweist.

Hier ist ein Bild des gesamten Systems:

Ein Diagramm eines generativen kontradiktorischen Netzwerks. In der Mitte des Diagramms befindet sich ein Feld mit der Beschriftung „#disk9tor“'. In dieses Feld fließen von links zwei Zweige ein.  Der obere Zweig beginnt oben links im Diagramm mit einem Zylinder mit der Bezeichnung „Bilder aus der realen Welt“. Von diesem Zylinder führt ein Pfeil zu einem Kästchen mit der Bezeichnung 'Sample'. Ein Pfeil aus dem Feld mit der Bezeichnung „Beispiel“ wird in das Feld „Diskrepanz“ eingefügt. Der untere Zweig wird in das Feld „Discriminator“ eingefügt, das mit einem Feld namens „Zufällige Eingabe“ beginnt. Ein Pfeil führt vom Feld „Zufällige Eingabe“ zu einem Feld mit der Bezeichnung &Generator ' Ein Pfeil führt vom Feld „Generator“ zu einem zweiten Feld „Sample“. Ein Pfeil führt vom Feld „Beispiel“ zum Feld „Discriminator“. Auf der rechten Seite des Discriminator-Feldes führt ein Pfeil zu einem Feld mit einem grünen und einem roten Kreis. Das Wort „Real“ wird in grüner Schrift über dem Feld und das Wort „Rot“ unter dem Feld angezeigt. Zwei Pfeile führen von diesem Feld zu zwei Kästchen auf der rechten Seite des Diagramms. Ein Pfeil führt zu einem Feld mit der Bezeichnung „Discriminator Loss'“. Der andere Pfeil führt zu einem Feld mit der Bezeichnung 'Generatorverlust'.

Sowohl der Generator als auch der Diskriminator sind neuronale Netzwerke. Die Generatorausgabe ist direkt mit der Eingabe des Diskriminators verbunden. Durch die Backpropagation liefert die Klassifizierung des Diskriminators ein Signal, mit dem der Generator seine Gewichtungen aktualisiert.

Sehen wir uns das System etwas genauer an.