Vì GAN chứa hai mạng được huấn luyện riêng biệt, nên thuật toán huấn luyện của GAN phải giải quyết hai vấn đề:
- GAN phải thực hiện hai loại huấn luyện khác nhau (trình tạo và trình phân biệt).
- Khó xác định được sự hội tụ của GAN.
Luyện tập xen kẽ
Trình tạo và trình phân biệt có các quy trình huấn luyện khác nhau. Vậy làm cách nào để chúng ta huấn luyện GAN tổng thể?
Quá trình huấn luyện GAN diễn ra theo các giai đoạn luân phiên:
- Bộ phân biệt được huấn luyện trong một hoặc nhiều epoch.
- Trình tạo huấn luyện cho một hoặc nhiều epoch.
- Lặp lại các bước 1 và 2 để tiếp tục huấn luyện mạng của trình tạo và trình phân biệt.
Chúng ta giữ nguyên trình tạo trong giai đoạn huấn luyện bộ phân biệt. Khi đào tạo bộ phân biệt cố gắng tìm ra cách phân biệt dữ liệu thực với dữ liệu giả, bộ phân biệt phải học cách nhận ra các lỗi của trình tạo. Đó là vấn đề khác đối với trình tạo được huấn luyện kỹ lưỡng so với trình tạo chưa được huấn luyện tạo ra kết quả ngẫu nhiên.
Tương tự, chúng ta giữ nguyên giá trị của hàm phân biệt trong giai đoạn huấn luyện trình tạo. Nếu không, trình tạo sẽ cố gắng đánh trúng mục tiêu đang di chuyển và có thể không bao giờ hội tụ.
Chính quá trình qua lại này cho phép GAN giải quyết các vấn đề tạo sinh khó giải quyết. Chúng ta có thể bắt đầu giải quyết vấn đề tạo sinh khó khăn bằng cách bắt đầu với một vấn đề phân loại đơn giản hơn nhiều. Ngược lại, nếu không thể đào tạo một thuật toán phân loại để phân biệt giữa dữ liệu thực và dữ liệu được tạo, ngay cả đối với đầu ra ban đầu của trình tạo ngẫu nhiên, thì bạn không thể bắt đầu quá trình huấn luyện GAN.
Hội tụ
Khi trình tạo cải thiện nhờ quá trình huấn luyện, hiệu suất của trình phân biệt sẽ xấu đi vì trình phân biệt không thể dễ dàng phân biệt giữa thật và giả. Nếu trình tạo thành công hoàn toàn, thì giá trị phân biệt sẽ có độ chính xác là 50%. Về cơ bản, bộ phân biệt sẽ tung đồng xu để đưa ra dự đoán.
Quá trình này gây ra vấn đề về sự hội tụ của GAN nói chung: phản hồi của bộ phân biệt trở nên ít có ý nghĩa hơn theo thời gian. Nếu GAN tiếp tục đào tạo sau thời điểm bộ phân biệt đưa ra phản hồi hoàn toàn ngẫu nhiên, thì trình tạo sẽ bắt đầu đào tạo dựa trên phản hồi rác và chất lượng của chính GAN có thể sụp đổ.
Đối với GAN, sự hội tụ thường là một trạng thái thoáng qua thay vì trạng thái ổn định.