تقليل الخسارة: نهج تكراري

عرضت الوحدة السابقة مفهوم الخسارة. وهنا، في هذه الوحدة، ستتعرف على كيف يقلل نموذج التعلم الآلي من الخسارة بالتكرار.

قد يذكرك التعلم التكراري بلعبة "Hot and Cold" التي تبحث عن شيء مخفي مثل كشتال. في هذه اللعبة، يكون "الكائن المخفي" أفضل نموذج ممكن. ستبدأ بتخمين قوي ("قيمة \(w_1\) تساوي 0.") وتنتظر حتى يخبرك النظام بالخسارة. بعد ذلك، ستجرّب تخمينًا آخر ("قيمة \(w_1\) تساوي 0.5") ورؤية ما هي الخسارة. آه، إنها تزداد دفئًا. في الواقع، إذا مارست هذه اللعبة بشكل صحيح، فستصبح أكثر دفئًا عادةً. تكمن الحيلة الحقيقية في اللعبة في محاولة العثور على أفضل نموذج ممكن بأكبر قدر ممكن من الكفاءة.

يشير الشكل التالي إلى عملية التجربة والخطأ التكرارية التي تستخدمها خوارزميات التعلم الآلي لتدريب نموذج:

يشير ذلك المصطلح إلى دورة الانتقال من الميزات والتصنيفات إلى النماذج والتوقعات.

الشكل 1. هو منهج تكراري لتدريب نموذج.

سنستخدم هذا النهج التكراري نفسه طوال الدورة التدريبية لتعطل التعلم الآلي، مع توضيح تفاصيل تعقيدات مختلفة، وخاصةً في تلك السحابة العاصفة التي تحمل اسم "النموذج (دالة التنبؤ)". انتشرت الاستراتيجيات التكرارية في التعلم الآلي، في المقام الأول، لأنها تتسع بشكل جيد إلى مجموعات البيانات الكبيرة.

يأخذ "النموذج" ميزة واحدة أو أكثر كمدخل ويعرض تنبؤًا واحدًا على أنه ناتج. لتبسيط الأمر، ضع في اعتبارك نموذجًا يعتمد ميزة واحدة (\(x_1\)) ويعرض توقعًا واحدًا (\(y'\)):

$$ y' = b + w_1x_1 $$

ما هي القيم الأولية التي يجب ضبطها لـ \(b\)و \(w_1\)؟ بالنسبة لمشكلات الانحدار الخطي، يتضح أن قيم البداية ليست مهمة. يمكننا اختيار قيم عشوائية، لكننا سنأخذ القيم التافهة التالية بدلاً من ذلك:

  • \(b\) = 0
  • \(w_1\) = 0

لنفترض أن قيمة الميزة الأولى هي 10. ينتج عن توصيل قيمة الميزة بدالة التنبؤ ما يلي:

$$ y' = 0 + 0 \cdot 10 = 0 $$

جزء "احتساب الخسارة" في الرسم البياني هو دالة الخسارة التي سيستخدمها النموذج. لنفترض أننا نستخدم دالة الخسارة التربيعية. تستخدم دالة الخسارة قيمتين للإدخال:

  • \(y'\): توقع النموذج للميزات x
  • \(y\): التصنيف الصحيح المقابل للميزات x.

وأخيرًا، وصلنا إلى الجزء "تعديلات معلَمات الحوسبة" في الرسم البياني. بعد ذلك يفحص نظام تعلُّم الآلة قيمة دالة الخسارة وينشئ قيمًا جديدة لـ \(b\) و \(w_1\). في الوقت الحالي، افترض أن هذا المربع الغامض يبتكر قيمًا جديدة ثم يعيد نظام التعلم الآلي تقييم جميع هذه الميزات مقابل جميع هذه التصنيفات، مما يؤدي إلى قيمة جديدة لدالة الخسارة، والتي ينتج عنها قيم معلمة جديدة. ويستمر التعلم في التكرار إلى أن تكتشف الخوارزمية معلمات النموذج ذات أقل خسارة محتملة. عادة، تقوم بالتكرار حتى تتوقف الخسارة الإجمالية عن التغير أو على الأقل تتغير ببطء شديد. عند حدوث ذلك، نقول إن النموذج قد تقارب.