الخلفية: ما هو النموذج التوليدي؟

ما المقصود بكلمة "توليدي" في اسم "الشبكة التوليدية التنافسية"؟ يصف "الإنشاء" فئة من النماذج الإحصائية التي تختلف عن نماذج التصنيف.

بشكل غير رسمي:

  • يمكن للنماذج التوليدية إنشاء نُسخ جديدة من البيانات.
  • تميّز النماذج التمييزية بين الأنواع المختلفة من مثيلات البيانات.

يمكن للنموذج التوليدي إنشاء صور جديدة للحيوانات تبدو مثل الحيوانات الحقيقية، في حين يمكن للنموذج التفريقي التمييز بين كلب وقطة. وتعدّ شبكات GAN نوعًا واحدًا فقط من النماذج التوليدية.

بشكل أكثر رسمية، في ما يلي مجموعة من عناصر البيانات X ومجموعة من التصنيفات Y:

  • تلتقط النماذج التوليدية الاحتمالية المشتركة p(X, Y)، أو p(X) فقط في حال عدم توفّر تصنيفات.
  • تُسجِّل النماذج التمييزية الاحتمالية الشَرطية p(Y | X).

يتضمّن النموذج التوليدي توزيع البيانات نفسها، ويُعلمك بمدى احتمالية ظهور مثال معيّن. على سبيل المثال، عادةً ما تكون النماذج التي تتوقّع الكلمة التالية في تسلسل هي نماذج توليدية (عادةً ما تكون أبسط بكثير من الشبكات التوليدية الجوّانية) لأنّها يمكنها تحديد احتمالية لتسلسل الكلمات.

يتجاهل النموذج التمييزي السؤال حول ما إذا كان حدث معيّن هو احتمالية، ويخبرك فقط بمدى احتمالية تطبيق تصنيف على الحدث.

يُرجى العِلم أنّ هذا تعريف عام جدًا. هناك العديد من أنواع نماذج الإنشاء. إنّ الشبكات التوليدية التنافسية هي نوع واحد فقط من النماذج التوليدية.

وضع نماذج الاحتمالات

ولا يجب أن يعرض أيّ من النوعَين رقمًا يمثّل احتمالية. يمكنك وضع نموذج لتوزيع البيانات من خلال تقليد هذا التوزيع.

على سبيل المثال، يمكن للمُصنِّف التفريقي، مثل شجيرة القرارات، تصنيف مثيل بدون تحديد احتمالية لذلك التصنيف. سيظلّ هذا المُصنِّف نموذجًا لأنّ توزيع جميع التصنيفات المتوقّعة سيمثّل التوزيع الحقيقي للتصنيفات في البيانات.

وبالمثل، يمكن للنموذج التوليدي إنشاء توزيع من خلال إنشاء بيانات "زائفة" مقنعة تبدو وكأنها مستمَدة من هذا التوزيع.

نماذج الذكاء الاصطناعي التوليدي هي نماذج صعبة

تعالج النماذج التوليدية مهمة أكثر صعوبة من النماذج التفريقية المشابهة. يجب أن تنشئ النماذج التوليدية مزيدًا من المحتوى.

قد يرصد نموذج التوليد للصور ارتباطات مثل "الأشياء التي تبدو مثل القوارب ستظهر على الأرجح بالقرب من الأشياء التي تبدو مثل الماء"، و "من غير المرجّح أن تظهر العيون على الجبهات". هذه توزيعات معقدة للغاية.

في المقابل، قد يتعرّف النموذج التمييزي على الفرق بين "قارب شراعي" أو "ليس قارب شراعي" من خلال البحث عن بعض الأنماط المميزة فقط. وقد يتجاهل العديد من الارتباطات التي يجب أن يحصل عليها النموذج التوليدي بشكل صحيح.

تحاول النماذج التفريقية وضع حدود في مساحة البيانات، بينما تحاول نماذج الإنشاء وضع نماذج لكيفية وضع البيانات في جميع أنحاء المساحة. على سبيل المثال، يعرِض المخطّط البياني التالي نماذج تمييزية ونشِئة للأرقام المكتوبة بخط اليد:

رسمان بيانيان، أحدهما يحمل التصنيف "نموذج تمييزي"
          والآخر يحمل التصنيف "نموذج توليدي" يعرض كلا الرسمَين البيانيَين
          نقاط البيانات الأربع نفسها. يتم تصنيف كل نقطة بالصورة
          للرقم المكتوب بخط اليد الذي تمثّله. في الرسم البياني
          التفريقي، هناك خطّ مُقَطّع يفصل نقطتَي بيانات عن
          النقطتَين المتبقيتَين. تم تصنيف المنطقة فوق الخط المُقَطَّع على أنّها "y=0"،
          وتم تصنيف المنطقة تحت الخط على أنّها "y=1". في الرسم البياني التوليدي،
          يتم رسم دائرتين منقطتَين حول الزوجَين من النقاط. 
          تم تصنيف الدائرة العلوية على أنّها "y=0" والدائرة السفلية على أنّها "y=1

الشكل 1: نماذج تمييزية ونشِئة للأرقام المكتوبة بخط اليد

يحاول النموذج التمييزي التمييز بين الأرقام 0 و1 المكتوبة بخط اليد من خلال رسم خط في مساحة البيانات. إذا تم تحديد الخط بشكل صحيح، يمكنه التمييز بين الأرقام 0 و1 بدون الحاجة إلى وضع نماذج لموضع العناصر في مساحة البيانات على أي من جانبَي الخط.

في المقابل، يحاول النموذج التوليدي إنشاء أصفار وآحاد مقنعة من خلال إنشاء أرقام قريبة من نظيراتها الحقيقية في فضاء البيانات. يجب أن يحدّد النموذج عملية التوزيع في مساحة البيانات.

توفّر الشبكات التوليدية الجوّانية طريقة فعّالة لتدريب هذه النماذج الغنية لتتشابه مع محتوى توزيعي حقيقي. لفهم آلية عملها، علينا فهم البنية الأساسية لشبكة GAN.

التحقّق من فهمك: النماذج التوليدية مقابل النماذج التمييزية

لديك نتائج اختبار الذكاء لـ 1,000 شخص. يمكنك وضع نموذج لتوزيع نتائج اختبار الذكاء باتّباع الإجراء التالي:
  1. رمي ثلاثة أحجار نرد سداسية الأوجه
  2. اضرب الدوران في ثابت w.
  3. كرِّر ذلك 100 مرة واحسب متوسط جميع النتائج.
يمكنك تجربة قيم مختلفة لمتغيّر w إلى أن تساوي نتيجة الإجراء متوسّط نتائج اختبار الذكاء الفعلية. هل النموذج هو نموذج تجميعي أم نموذج تمييزي؟
نموذج تولّدي
صحيح: مع كل رمي، يتم إنشاء معدل الذكاء لشخصية imaginnary بشكل فعّال. بالإضافة إلى ذلك، يوضّح النموذج التوليدي حقيقة أنّه يتم توزيع نتائج اختبار الذكاء بشكل طبيعي (أي على منحنى جرس).
نموذج تمييزي
خطأ: سيحاول نموذج تمييزي مشابه التمييز بين الأنواع المختلفة لنتائج اختبار الذكاء. على سبيل المثال، قد يحاول نموذج تمييزي تصنيف ذكاء اصطناعي على أنّه اصطناعي أو حقيقي.
لا تتوفّر معلومات كافية لمعرفة ذلك.
يتطابق هذا النموذج بالفعل مع تعريف أحد نوعَي النماذج.
يعرض النموذج احتمالية عندما تقدّم له مثيل بيانات. هل هذا النموذج نموذج تجميعي أم نموذج تمييزي؟
نموذج تولّدي
يمكن للنموذج التوليدي تقدير احتمالية العنصر، وكذلك احتمالية تصنيف الفئة.
نموذج تمييزي
يمكن للنموذج التفريقي تقدير احتمالية انتماء مثيل إلى فئة معيّنة.
لا تتوفّر معلومات كافية لمعرفة ذلك.
يمكن لكلٍّ من النماذج التوليدية والتمييزية تقدير الاحتمالات (ولكن ليس بالضرورة).