Tổng quan về cấu trúc GAN

Mạng đối nghịch tạo sinh (GAN) có hai phần:

  • Trình tạo học cách tạo dữ liệu hợp lý. Các thực thể được tạo sẽ trở thành ví dụ huấn luyện âm tính cho hàm phân biệt.
  • Bộ phân biệt học cách phân biệt dữ liệu giả của trình tạo với dữ liệu thực. Bộ phân biệt sẽ phạt trình tạo vì tạo ra kết quả không hợp lý.

Khi quá trình huấn luyện bắt đầu, trình tạo sẽ tạo ra dữ liệu giả mạo rõ ràng và trình phân biệt nhanh chóng học được cách nhận biết dữ liệu giả mạo:

Ba cột được gắn nhãn "Dữ liệu được tạo", "Đặc tính phân biệt" và "Dữ liệu thực". Trong mục "Dữ liệu đã tạo", một hình chữ nhật màu xanh dương chứa một đường cong ngoằn ngoèo và một vòng tròn. Hình chữ nhật là nỗ lực đầu tiên và không thành công của trình tạo để vẽ một tờ đô la. Trong phần "Dữ liệu thực", có một hình ảnh của một tờ tiền 10 đô la thật. Trong phần "Đặc điểm phân biệt" là các từ "FAKE" (GIẢ) và "REAL" (THẬT). Một mũi tên chỉ từ từ "FAKE" (GIẢ) đến hình ảnh trong mục "Generated Data" (Dữ liệu được tạo). Một mũi tên khác chỉ từ từ "REAL" (THỰC) đến hình ảnh trong mục "Real Data" (Dữ liệu thực).

Khi quá trình huấn luyện diễn ra, trình tạo sẽ tiến gần hơn đến việc tạo ra kết quả có thể đánh lừa bộ phân biệt:

Hình ảnh này thêm một hàng mới trong tiêu đề "Dữ liệu được tạo", "Đặc tính phân biệt" và "Dữ liệu thực" trong hình ảnh trước. Trong mục "Dữ liệu đã tạo", bạn sẽ thấy một hình chữ nhật màu xanh lục có số 10 ở góc trên bên trái và một hình vẽ khuôn mặt đơn giản. Trong phần "Dữ liệu thực", có một hình ảnh của một tờ 100 đô la thật. Trong phần "Đặc điểm phân biệt" là từ "FAKE" (GIẢ) có một mũi tên trỏ đến hình ảnh trong phần "Dữ liệu được tạo" và từ "REAL" (THẬT) có một mũi tên trỏ đến hình ảnh trong phần "Dữ liệu thực".

Cuối cùng, nếu quá trình huấn luyện trình tạo diễn ra tốt, thì giá trị phân biệt sẽ kém hiệu quả hơn trong việc phân biệt giữa thật và giả. Mô hình này bắt đầu phân loại dữ liệu giả mạo là dữ liệu thực và độ chính xác của mô hình sẽ giảm.

Hình ảnh này thêm một hàng mới trong tiêu đề "Dữ liệu được tạo", "Đặc tính" và "Dữ liệu thực" trong hình ảnh đầu tiên trước đó. Trong mục "Dữ liệu được tạo", có hình ảnh một tờ 20 đô la. Trong phần "Dữ liệu thực", có hình ảnh một tờ 20 đô la. Trong phần "Đặc tính phân biệt" là từ "REAL" (THỰC) có mũi tên trỏ đến hình ảnh trong phần "Dữ liệu được tạo" và từ "REAL" (THỰC) có mũi tên trỏ đến hình ảnh trong phần "Dữ liệu thực".

Dưới đây là hình ảnh toàn bộ hệ thống:

Sơ đồ của một mạng đối kháng tạo sinh. Ở giữa sơ đồ là một hộp có nhãn "bộ phân biệt". Hai nhánh cấp dữ liệu vào hộp này từ bên trái.  Nhánh trên cùng bắt đầu ở phía trên bên trái của sơ đồ với một hình trụ có nhãn "hình ảnh thực tế". Một mũi tên dẫn từ hình trụ này đến một hộp có nhãn "Mẫu". Một mũi tên từ hộp có nhãn "Mẫu" sẽ chuyển vào hộp "Đặc tính phân biệt". Nhánh dưới cùng sẽ chuyển vào hộp "Discriminator" (Đặc tính phân biệt) bắt đầu bằng một hộp có nhãn "Random Input" (Dữ liệu đầu vào ngẫu nhiên). Một mũi tên dẫn từ hộp "Random Input" (Dữ liệu đầu vào ngẫu nhiên) đến một hộp có nhãn "Generator" (Trình tạo). Một mũi tên dẫn từ hộp "Trình tạo" đến hộp "Mẫu" thứ hai. Một mũi tên dẫn từ hộp "Mẫu" đến hộp "Đặc tính phân biệt". Ở bên phải hộp Discriminator (Bộ phân biệt), một mũi tên dẫn đến một hộp chứa một vòng tròn màu xanh lục và một vòng tròn màu đỏ. Từ "Thực" xuất hiện bằng văn bản màu xanh lục phía trên hộp và từ "Giả" xuất hiện bằng văn bản màu đỏ bên dưới hộp. Hai mũi tên dẫn từ hộp này đến hai hộp ở bên phải sơ đồ. Một mũi tên dẫn đến một hộp có nhãn "Mất giá trị phân biệt". Mũi tên còn lại dẫn đến một hộp có nhãn "Mất mát của máy phát".

Cả trình tạo và trình phân biệt đều là mạng nơron. Đầu ra của trình tạo được kết nối trực tiếp với đầu vào của bộ phân biệt. Thông qua phương pháp truyền ngược, hoạt động phân loại của bộ phân biệt sẽ cung cấp một tín hiệu mà trình tạo sử dụng để cập nhật trọng số của nó.

Hãy cùng giải thích chi tiết hơn về các phần của hệ thống này.