الشبكات العصبية: البنية

لمعرفة كيف يمكن أن تساعد الشبكات العصبية في حل المسائل غير الخطية، لنبدأ من خلال تمثيل نموذج خطي كرسم بياني:

ثلاث دوائر زرقاء في صف تربطها أسهم بدائرة خضراء فوقها

الشكل 3. النموذج الخطي كرسم بياني.

تمثل كل دائرة زرقاء ميزة إدخال، وتمثل الدائرة الخضراء المجموع المرجح للمدخلات.

كيف يمكننا تغيير هذا النموذج لتحسين قدرته على التعامل مع البيانات غير الخطية المشكلات؟

الطبقات المخفية

في النموذج الذي يمثله الرسم البياني التالي، أضفنا "طبقة مخفية" للقيم الوسيطة. كل عقدة صفراء موجودة في الطبقة المخفية هي مجموع مرجّح قيم عقدة الإدخال الزرقاء. ويكون الناتج مجموعًا مرجّحًا للقيم الصفراء العُقد.

ثلاث دوائر زرقاء في صف مصنّف

الشكل 4. الرسم البياني للنموذج المكوَّن من طبقتَين

هل هذا النموذج خطي؟ نعم — لا يزال مخرجها عبارة عن مجموعة خطية المدخلات الخاصة به.

في النموذج الذي يمثله الرسم البياني التالي، أضفنا عمودًا ثانيًا مخفيًا طبقة من المجاميع المُرجّحة.

ثلاث دوائر زرقاء في صف مصنّف

الشكل 5. رسم بياني لنموذج مكوّن من ثلاث طبقات

هل لا يزال هذا النموذج خطيًا؟ نعم. عندما تعبر عن المخرجات للإدخال وتبسيطه، ستحصل على مجموع مرجّح آخر المدخلات. ولن يقدم هذا المجموع نموذج فعال للمسألة غير الخطية في الشكل 2.

وظائف التفعيل

لوضع نموذج لمسألة غير خطية، يمكننا طرح العلاقة غير الخطية مباشرةً. يمكننا كل عقدة طبقة مخفية من خلال دالة غير خطية.

في النموذج الذي يمثله الرسم البياني التالي، تشير قيمة كل عقدة في يتم تحويل الطبقة المخفية 1 بواسطة دالة غير خطية قبل تمريرها على إلى المبالغ المُرجحة للطبقة التالية. وهذه الدالة غير الخطية تُسمى دالة وظيفة التفعيل.

تمامًا مثل الشكل السابق، باستثناء وجود صف من الدوائر الوردية المسمى "طبقة التحويل غير الخطي" تمت إضافته بين الطبقتين المخفيتين.

الشكل 6. رسم بياني لنموذج ثلاثي الطبقات مع وظيفة التفعيل

والآن بعد أن أضفنا دالة تنشيط، أصبح لإضافة الطبقات تأثير أكبر. يتيح لنا تكديس العناصر غير الخطية على العناصر غير الخطية وضع نماذج معقّدة للغاية العلاقات بين المدخلات والمخرجات المتوقعة. باختصار، التعرف بشكل فعال على دالة أكثر تعقيدًا وذات مستوى أعلى عبر المدخلات الأولية. إذا كنت ترغب في اكتساب المزيد من المعرفة حول كيفية عمل ذلك، فراجع مشاركة المدوّنة الرائعة التي نشرها "كريس أولا".

وظائف التفعيل الشائعة

تحوّل دالة التفعيل السيني التالية المجموع المرجح إلى قيمة بين 0 و1.

$$F(x)=\frac{1} {1+e^{-x}}$$

إليك مخطط:

الدالّة الإسية

الشكل 7. دالة التفعيل السيني.

دالة التفعيل التالية للوحدة الخطية التي تم تصحيحها (أو ReLU، قصيرة) تعمل بشكل أفضل قليلاً من الدالة السلسة مثل الدالة السينية، مع كونها أسهل في الحساب أيضًا.

$$F(x)=max(0,x)$$

يستند تفضيل ReLU إلى نتائج تجريبية، ومن المحتمل أن تكون هذه القيم مستندة إلى ReLU. الحصول على نطاق أكثر فائدة من الاستجابة. تسقط استجابة الكائن السيني بسرعة نسبيًا من كلا الجانبين.

وظيفة تفعيل ReLU

الشكل 8. وظيفة تفعيل ReLU.

في الواقع، يمكن أن تكون أي دالة رياضية بمثابة دالة تفعيل. لنفترض أن \(\sigma\) يمثل دالة التفعيل (Relu أو Sigmoid أو غير ذلك). وبالتالي، يتم تحديد قيمة أي عقدة في الشبكة من خلال ما يلي المعادلة:

$$\sigma(\boldsymbol w \cdot \boldsymbol x+b)$$

ملخّص

والآن، يحتوي نموذجنا على جميع المكونات القياسية لما يفكر فيه الأشخاص ما يعني أنه عند قول "الشبكة العصبونية":

  • مجموعة من العُقد، مماثلة للخلايا العصبية، مرتبة في طبقات.
  • مجموعة من الأوزان تمثل الاتصالات بين كل شبكة عصبية الطبقة والطبقة الموجودة أسفلها. قد تكون الطبقة الموجودة أسفل طبقة شبكة عصبية أخرى أو أي نوع آخر من الطبقات.
  • مجموعة من التحيزات، واحد لكل عقدة.
  • يشير ذلك المصطلح إلى دالة تفعيل تعمل على تحويل مخرجات كل عقدة في طبقة معيّنة. قد يكون للطبقات المختلفة دوال تنشيط مختلفة.

تنبيه: الشبكات العصبية ليست بالضرورة أفضل من الخصائص، لكن الشبكات العصبية توفر بديلاً مرنًا بشكل جيد في كثير من الحالات.