نظرة عامة على بنية GAN

تتكوّن الشبكة التنافسية التوليدية (GAN) من جزأين:

  • يتعلم المنشئ إنشاء بيانات معقولة. تصبح النماذج التي تم إنشاؤها أمثلة تدريب سلبية لنموذج التمييز.
  • يتعلم المميّز التمييز بين البيانات المزيّفة التي ينشئها "أداة إنشاء الصور" وال data الحقيقية. يفرض المعرِّف عقوبة على المولد بسبب إنتاجه لنتائج غير معقولة.

عند بدء التدريب، يُنشئ المُنشئ بيانات زائفة بشكل واضح، ويتعلم المُميِّز بسرعة أنّها زائفة:

تم تصنيف ثلاثة أعمدة على أنّها "البيانات التي تم إنشاؤها" و"المميّز" و
          "البيانات الحقيقية". ضمن "البيانات التي تم إنشاؤها"، يتضمّن مستطيل أزرق
          شكلاً متعرجًا ودائرة. المستطيل هو محاولة
          المنشئ الأولى السيئة
          لرسم ورقة دولار أمريكي. ضمن "البيانات الحقيقية"، تظهر صورة لعملة حقيقية
          من فئة عشرة دولار أمريكي. ضمن "المميّز"، تظهر الكلمات "FAKE" و
          'REAL". يشير سهم من كلمة "FAKE" إلى الصورة ضمن
          'البيانات التي تم إنشاؤها". يشير سهم آخر من كلمة "حقيقية" إلى
          الصورة ضمن "البيانات الحقيقية".

مع تقدّم عملية التدريب، يقترب المُنشئ من إنتاج نتائج يمكنها خداع المُميِّز:

تضيف هذه الصورة صفًا جديدًا ضمن العناوين "البيانات التي تم إنشاؤها" و"المميّز"
          و"البيانات الحقيقية" في الصورة السابقة. ضمن "البيانات التي تم إنشاؤها"،
          يظهر مستطيل أخضر يتضمّن الرقم 10 في أعلى يمين الشاشة
          ورسم بسيط لوجه. ضمن "البيانات الحقيقية"، تظهر صورة
          لورق دولار أمريكي فئة 100. ضمن "المميّز"، تظهر الكلمة "FAKE" مع
         سهم يشير إلى الصورة ضمن "البيانات التي تم إنشاؤها" والكلمة
          'REAL" مع سهم يشير إلى الصورة ضمن "البيانات الحقيقية".

أخيرًا، إذا سارت عملية تدريب المولد على ما يرام، سيتدهّر أداء المميّز في معرفة الفرق بين الصور الحقيقية والمزيفة. يبدأ في تصنيف البيانات المزيّفة على أنّها حقيقية، وتقل دقته.

تضيف هذه الصورة صفًا جديدًا ضمن العناوين "البيانات التي تم إنشاؤها" و"المميّز"
          و"البيانات الحقيقية" في الصورة السابقة الأولى. ضمن "البيانات
          التي تم إنشاؤها"، تظهر صورة لعملة ورقية بقيمة 20 دولارًا أمريكيًا. ضمن "البيانات الحقيقية
          تظهر صورة لعملة ورقية بقيمة 20 دولارًا أمريكيًا. ضمن "المميّز"،
          تظهر الكلمة "حقيقية" مع
          سهم يشير إلى الصورة ضمن "البيانات التي تم إنشاؤها" والكلمة
          'حقيقية" مع سهم يشير إلى الصورة ضمن "البيانات الحقيقية".

في ما يلي صورة للنظام بأكمله:

مخطّط بياني لشبكة تنافسية إبداعية في وسط المخطّط البياني، هناك مربّع يحمل اسم "المميّز". يتدفّق فرعان إلى هذا
          المربّع من اليسار.  يبدأ الفرع العلوي في أعلى يمين المخطط البياني
          مع أسطوانة تحمل تصنيف "صور العالم الحقيقي". يشير سهم إلى
          أسطوانة تؤدي إلى صندوق يحمل تصنيف "عيّنة". سهم من المربّع
          الذي يحمل التصنيف "عيّنة" ينتقل إلى المربّع "المميّز". يتم توجيه الفرع السفلي
          إلى مربّع "المميّز" بدءًا من مربّع بعنوان "إدخال
          عشوائي". ينقل سهم من مربّع "إدخال عشوائي" إلى مربّع بعنوان
          'أداة إنشاء". ينقل سهم من مربّع "المنشئ" إلى مربّع
          'عيّنة" ثانٍ. ينقل سهم من مربّع "العيّنة" إلى
          'مربّع الفاصل. على الجانب الأيمن من مربّع "العنصر الفاصل"، يؤدي سهم
          إلى مربّع يحتوي على دائرة خضراء ودائرة حمراء. تظهر
          كلمة "صحيح" باللون الأخضر فوق المربّع وكلمة "خطأ"
          باللون الأحمر أسفل المربّع. يخرج من هذا المربّع سهمان يؤديان إلى مربّعَين
          على يمين المخطّط البياني. يؤدي أحد الأسهم إلى مربّع
          يحمل العنوان "الخسارة في معرّف الفئات". يؤدي السهم الآخر إلى مربّع يحمل التصنيف
          'فقدان المولد".

كلّ من المولد والمحرِّف هما شبكتَان عصبيتان. يتم توصيل مخرج المولد مباشرةً بمدخل المميّز. من خلال الانتشار العكسي، يقدّم تصنيف المميّز إشارة يستخدمها المُنشئ لتعديل أوزانه.

لنوضّح أجزاء هذا النظام بمزيد من التفصيل.