「敵対的ネットワーク生成」という名前で「ジェネレーティブ」とはどういう意味ですか? "ジェネレーティブ" は、判別モデルと対照的な統計モデルのクラスを表しています。
非公式に:
- ジェネレーティブ モデルは、新しいデータ インスタンスを生成できます。
- 差別モデルは、さまざまな種類のデータ インスタンスを区別します。
生成モデルでは、実際の動物のように見える新しい動物の写真を生成できますが、識別モデルでは猫から犬を判別できます。GAN は 1 種類のみ生成モデルです。
より正式には、一連のデータ インスタンス X と一連のラベル Y があるとします。
- ジェネレーティブ モデルは、ジョイント確率 p(X, Y) をキャプチャします。ラベルがない場合は、p(X) のみをキャプチャします。
- 判別式モデルは、条件付き確率 p(Y | X) をキャプチャします。
ジェネレーティブ モデルは、データ自体の分布を含み、特定の例がどの程度の可能性を示すかを示します。たとえば、シーケンス内の次の単語を予測するモデルは、一般的にシーケンスに単語を割り当てることができるため、生成モデル(通常は GAN よりもはるかにシンプル)です。
識別モデルでは、特定のインスタンスの可能性について質問が無視され、インスタンスへのラベル適用の可能性が示されます。
これは非常に一般的な定義です。生成モデルにはさまざまな種類があります。GAN は一種の生成モデルにすぎません。
モデリングの確率
いずれの種類のモデルでも、確率を表す数値を返す必要はありません。データの分布は、模倣することでモデル化できます。
たとえば、ディシジョン ツリーのような差別的な分類器では、ラベルに確率を割り当てることなくインスタンスにラベルを適用できます。予測されたすべてのラベルの分布はデータ内のラベルの実際の分布をモデル化するため、このような分類器はモデルのままです。
同様に、ジェネレーティブ モデルは、その分布から引き出された説得力のある「偽」データを生成することによって、分布をモデル化できます。
生成モデルは困難
生成モデルは、類似の判別モデルよりも難しいタスクに取り組んでいます。ジェネレーティブ モデルはさらにモデル化する必要があります。
画像生成モデルでは、「ボート」のようなものが水に似たものに見える相関関係を捕捉できます。また、「目」が額に表示される可能性は低くなります。これらは非常に複雑な分布です。
一方で、識別モデルでは「ヨット」と「ヨット以外」の違いを学習できます。生成モデルが正しく対応する必要がある多くの相関関係は無視できます。
判別モデルはデータ空間に境界を描画しようとし、生成モデルは空間内にデータをどのように配置するかをモデル化します。たとえば、次の図は手書き数字の判別モデルと生成モデルを示しています。
図 1: 手書きの数字の判別モデルと生成モデル。
判別モデルは、データ空間に線を引いて、手書きの 0 と 1 の違いを区別しようとします。ラインを正しく取得すると、ラインの両側のデータ空間でインスタンスが配置されている場所を正確にモデル化することなく、0 と 19 を区別できます。
一方、ジェネレーティブ モデルは、データ空間の中の対応する値に近い数字を生成することによって、説得力のある 1 と 0 を生成します。データ空間全体での分布をモデル化する必要がある。
GAN は、このような実際のモデルをトレーニングして実際の分布に近づけるための効果的な方法です。仕組みを理解するには、GAN の基本構造を理解する必要があります。
理解度をチェック: 生成モデルと差別モデル
- 6 面のサイコロを 3 つ振る。
- 出目に定数「w」を乗じます。
- 100 回繰り返し、すべての結果の平均を取ります。