تدريب على شبكة GAN

نظرًا لأن شبكة GAN تحتوي على شبكتين تدريبيتين منفصلتين، يجب أن تعالج خوارزمية التدريب الخاصة بها مضاعفتين:

  • يجب أن تعتمد شبكة GAN على نوعين مختلفين من التدريب (المنشئ والمميّز).
  • من الصعب التعرّف على مدى الصلة بأرقام GAN.

تدريب بديل

تختلف إجراءات التدريب بين المنشئ والمميِّز. كيف يمكننا تدريب GAN بالكامل؟

تتم مواصلة تدريب GAN في فترات بديلة:

  1. ويتدرّب التمييز على حقبة واحدة أو أكثر.
  2. ويتدرّب المنشئ على مستوى فترة واحدة أو أكثر.
  3. كرِّر الخطوتين 1 و2 لمواصلة تدريب شبكات المُنشئ والمميّزات.

نحافظ على ثبات المنشئ أثناء مرحلة تدريب التمييز. يهدف تدريب التمييز إلى معرفة كيفية تمييز البيانات الحقيقية عن المنتجات الزائفة، لذا تعلّم كيفية التعرّف على عيوب المولد. هذه مشكلة مختلفة لمولد تدريب مدرّب جيدًا مقارنة بمولد غير مدرّب ينتج مخرجات عشوائية.

بالمثل، نحرص على التمييز في مراحل تدريب المنشئ. وإلا فإن المنشئ سيحاول الوصول إلى هدف متحرك وقد لا يتداخل مطلقًا.

ويسمح ذلك لكل من الشركات بالتعامل مع مشاكل جيلية لا يمكن حلّها. نحن نتصدّى للمشكلة الصعبة الصعبة من خلال البدء بمشكلة تصنيف أكثر بساطة. وبالعكس، إذا لم تتمكّن من تدريب مصنّف على التمييز بين البيانات الحقيقية والمنشأة حتى في المخرجات المبدئية للمنشئين العشوائيين، لا يمكنك بدء تدريب GAN.

تقارب

ومع تحسّن المنشئ بشكل ملحوظ من خلال التدريب، يتحسّن أداء التمييز لأنّه لا يمكن التمييز بين الواقع والمزيف بسهولة. إذا نجح المنشئ في تحقيق نتائج ممتازة، سيحصل التمييز على دقة 50%. ومن ناحية أخرى، يعمل التمييز على قلب عملة معدنية لتوقّع ما يحدث.

ويشكّل هذا تقدّمًا مشكلة تؤدّي إلى جعل شبكة GAN ككل. وملاحظات المُميِّز تصبح أقل أهمية بمرور الوقت. إذا استمرّ GAN في التدريب بعد أن يتلقّى المتغيّر ملاحظات عشوائية تمامًا، يبدأ المُنشئ في التدرّب على الملاحظات غير المهمة، وقد تتدهور جودته.

بالنسبة إلى شبكة GAN، غالبًا ما تكون نقطة الاختلاف عابرة وليست ثابتة.