GAN の構造の概要

敵対的生成ネットワーク(GAN)には 2 つの部分があります。

  • 生成ツールは、もっと現実的なデータを生成することを学習します。生成されたインスタンスは、区別器のトレーニング サンプルになります。
  • discriminator は、ジェネレータの疑似データと実際のデータを区別する方法を学びます。識別器がジェネレータにペナルティを課して、現実的な結果を生成します。

トレーニングを開始すると、ジェネレータは明らかに偽のデータを生成し、判別器は偽のものであるとすぐに学習します。

3 つの列は、'Generated Data'、##Discriminator'、および Real Data' というラベルが付いています。[生成されたデータ] で、青色の長方形に波線と円が含まれています。長方形は発電機が初めて不正な請求を犯そうとする試みです。実際のデータとは、10 ドルの実際の請求書の写真です。'Discriminator'は 'FAKE''REAL'です。矢印は「FAKE' FAKE'」から「Generated Data' 」までの画像を指しています。もう 1 つの矢印は「実際の」という言葉から「実際のデータ」の下の画像を指しています。

ジェネレータはトレーニングが進むにつれ、判別器をだますような出力に近づきます。

この画像は、[&生成されたデータ] の下に、新しい行を追加します。前の画像にある見出し。' 生成されたデータ' 
          の左上隅に数字 10 の緑色の長方形と
          顔の簡単な図があります。実際のデータ' には、実際の 100 ドル札の画像があります。'Discriminator'は単語 ' FAKE'は矢印で ' Generated Data'という単語は' REAL'矢印は ' Real Data'の下。

最後に、ジェネレータのトレーニングがうまくいくと、判別器が本物と偽物の違いを伝えるのが悪くなります。架空のデータを実際のものとして分類するようになるため、精度が低くなります。

この画像は、' Generated Data'、'Discriminator', & 'Real Data' 見出しの最初の画像の下に、新しい行を追加します。'Generated Data' に 20 ドルの請求書の画像があります。そこには、「実際のデータ」の 20 ドル札の画像が表示されています。'Discriminator'は単語 ' REAL'は矢印で ' Generated Data'という単語は' REAL'矢印は ' Real Data'の下。

システム全体の写真は次のようになります。

敵対的生成ネットワーク図。図の中央には、'discriminator' というラベルの付いたボックスがあります。左から 2 つの分岐がこの箱に入ります。上の分岐は、図の左上から、「実際の画像」というラベルが付いた円柱で始まっています。この円柱から、「'サンプル'」というラベルの付いた箱に矢印が伸びています。'Sample' というラベルのボックスからの矢印が 'Discriminator' ボックスに入力されます。下の分岐は、'Discriminator' ボックスに入って、'Random Input' というラベルの付いたボックスで始めます。矢印が「ランダム入力」ボックスから「Generator」というラベルの付いたボックスに移動します。矢印が Generator から 2 番目のボックスまで進みます。矢印が [サンプル] ボックスから [識別] ボックスまで進みます。Discriminator ボックスの右側に、緑色の円と赤の円を含む箱に向かって矢印が伸びています。「Real'」という単語はボックスの上を緑色のテキストで、'False' がボックスの下に赤で表示されます。この箱から、図の右側の 2 つの箱に向かって、2 つの矢印が伸びています。1 つの矢印が「差別的損失」のラベルが付いたボックスにつながる。もう 1 つの矢印は、発電機の損失と書かれたボックスまでつながっています。

ジェネレータと判別器はどちらもニューラル ネットワークです。ジェネレータ出力は、ディスクリミネータ入力に直接接続されます。再伝播を通じて、Discriminator の分類は、ジェネレータが重みの更新に使用するシグナルを提供します。

このシステムについて、詳しく説明します。