生成對抗網路 (GAN) 包含兩個部分:
- 產生器會學習產生可產生的資料。產生的執行個體會成為歧視器的負面訓練範例。
- 歧視器學習如何將產生器和假資料與實際資料區分開來。歧視者會對生成機產生懲罰。
訓練開始時,產生器會產生明顯的假資料,而歧視器會快速學習它知道這是假的。
訓練進行時,產生器會更接近產生會產生結果的輸出內容:
最後,如果產生器產生器的運作情況良好,辨別器就更顯而易見的實際和虛構差異。這會開始將假資料真實分類,準確度也會降低。
整個系統的圖片如下:
產生器和歧視者都是類神經網路。產生器輸出結果會直接連結至歧視輸入內容。透過反向傳播,歧視器的分類提供了發電機用來更新權重的訊號。
讓我們來詳細說明這個系統的各個部分。