ما المقصود بكلمة "توليدي" في اسم "الشبكة التوليدية التنافسية"؟ يصف "الإنشاء" فئة من النماذج الإحصائية التي تختلف عن نماذج التصنيف.
بشكل غير رسمي:
- يمكن للنماذج التوليدية إنشاء نُسخ جديدة من البيانات.
- تميّز النماذج التمييزية بين الأنواع المختلفة من مثيلات البيانات.
يمكن للنموذج التوليدي إنشاء صور جديدة للحيوانات تبدو مثل الحيوانات الحقيقية، في حين يمكن للنموذج التفريقي التمييز بين كلب وقطة. وتعدّ شبكات GAN نوعًا واحدًا فقط من النماذج التوليدية.
بشكل أكثر رسمية، في ما يلي مجموعة من عناصر البيانات X ومجموعة من التصنيفات Y:
- تلتقط النماذج التوليدية الاحتمالية المشتركة p(X, Y)، أو p(X) فقط في حال عدم توفّر تصنيفات.
- تُسجِّل النماذج التمييزية الاحتمالية الشَرطية p(Y | X).
يتضمّن النموذج التوليدي توزيع البيانات نفسها، ويُعلمك بمدى احتمالية ظهور مثال معيّن. على سبيل المثال، عادةً ما تكون النماذج التي تتوقّع الكلمة التالية في تسلسل هي نماذج توليدية (عادةً ما تكون أبسط بكثير من الشبكات التوليدية الجوّانية) لأنّها يمكنها تحديد احتمالية لتسلسل الكلمات.
يتجاهل النموذج التمييزي السؤال حول ما إذا كان حدث معيّن هو احتمالية، ويخبرك فقط بمدى احتمالية تطبيق تصنيف على الحدث.
يُرجى العِلم أنّ هذا تعريف عام جدًا. هناك العديد من أنواع نماذج الإنشاء. إنّ الشبكات التوليدية التنافسية هي نوع واحد فقط من النماذج التوليدية.
وضع نماذج الاحتمالات
ولا يجب أن يعرض أيّ من النوعَين رقمًا يمثّل احتمالية. يمكنك وضع نموذج لتوزيع البيانات من خلال تقليد هذا التوزيع.
على سبيل المثال، يمكن للمُصنِّف التفريقي، مثل شجيرة القرارات، تصنيف مثيل بدون تحديد احتمالية لذلك التصنيف. سيظلّ هذا المُصنِّف نموذجًا لأنّ توزيع جميع التصنيفات المتوقّعة سيمثّل التوزيع الحقيقي للتصنيفات في البيانات.
وبالمثل، يمكن للنموذج التوليدي إنشاء توزيع من خلال إنشاء بيانات "زائفة" مقنعة تبدو وكأنها مستمَدة من هذا التوزيع.
نماذج الذكاء الاصطناعي التوليدي هي نماذج صعبة
تعالج النماذج التوليدية مهمة أكثر صعوبة من النماذج التفريقية المشابهة. يجب أن تنشئ النماذج التوليدية مزيدًا من المحتوى.
قد يرصد نموذج التوليد للصور ارتباطات مثل "الأشياء التي تبدو مثل القوارب ستظهر على الأرجح بالقرب من الأشياء التي تبدو مثل الماء"، و "من غير المرجّح أن تظهر العيون على الجبهات". هذه توزيعات معقدة للغاية.
في المقابل، قد يتعرّف النموذج التمييزي على الفرق بين "قارب شراعي" أو "ليس قارب شراعي" من خلال البحث عن بعض الأنماط المميزة فقط. وقد يتجاهل العديد من الارتباطات التي يجب أن يحصل عليها النموذج التوليدي بشكل صحيح.
تحاول النماذج التفريقية وضع حدود في مساحة البيانات، بينما تحاول نماذج الإنشاء وضع نماذج لكيفية وضع البيانات في جميع أنحاء المساحة. على سبيل المثال، يعرِض المخطّط البياني التالي نماذج تمييزية ونشِئة للأرقام المكتوبة بخط اليد:
الشكل 1: نماذج تمييزية ونشِئة للأرقام المكتوبة بخط اليد
يحاول النموذج التمييزي التمييز بين الأرقام 0 و1 المكتوبة بخط اليد من خلال رسم خط في مساحة البيانات. إذا تم تحديد الخط بشكل صحيح، يمكنه التمييز بين الأرقام 0 و1 بدون الحاجة إلى وضع نماذج لموضع العناصر في مساحة البيانات على أي من جانبَي الخط.
في المقابل، يحاول النموذج التوليدي إنشاء أصفار وآحاد مقنعة من خلال إنشاء أرقام قريبة من نظيراتها الحقيقية في فضاء البيانات. يجب أن يحدّد النموذج عملية التوزيع في مساحة البيانات.
توفّر الشبكات التوليدية الجوّانية طريقة فعّالة لتدريب هذه النماذج الغنية لتتشابه مع محتوى توزيعي حقيقي. لفهم آلية عملها، علينا فهم البنية الأساسية لشبكة GAN.
التحقّق من فهمك: النماذج التوليدية مقابل النماذج التمييزية
- رمي ثلاثة أحجار نرد سداسية الأوجه
- اضرب الدوران في ثابت w.
- كرِّر ذلك 100 مرة واحسب متوسط جميع النتائج.