الانحدار الخطي: الخسارة

الخسارة عبارة عن مقياس عددي يصف مدى خطأ توقّعات النموذج تقيس مقياس الخسارة المسافة بين تنبؤات النموذج والقيم الفعلية الفعلية. إن الهدف من تدريب أي نموذج هو تقليل الخسارة وخفضها إلى أقل قيمة ممكنة.

في الصورة التالية، يمكنك تصور الخسارة في شكل أسهم مرسومة من البيانات تشير إلى النموذج. تشير الأسهم إلى مدى بُعد تنبؤات النموذج عن القيم الفعلية.

الشكل 9. تربط خطوط الخسارة نقاط البيانات
الأمثل.

الشكل 9. ويتم قياس الخسارة من القيمة الفعلية إلى القيمة المتنبأ بها.

مسافة الخسارة

في الإحصاء والتعلم الآلي، تقيس الخسارة الفرق بين القيم المتنبأ بها والقيم الفعلية. يركز مقياس الخسارة على المسافة بين القيم، وليس الاتجاه. على سبيل المثال، إذا توقع نموذج العدد 2، ولكن القيمة الفعلية هي 5، لا يهمنا أن تكون الخسارة سالبة إلى -3 دولار أمريكي ($ 2-5=-3 دولار). بدلاً من ذلك، نحرص على أن تكون المسافة بين القيمتين $ 3 $. وبالتالي، لحساب الخسارة وإزالة العلامة.

في ما يلي طريقتان أكثر شيوعًا لإزالة العلامة:

  • استخرِج القيمة المطلقة للفرق بين القيمة الفعلية التنبؤ.
  • تربيع الفرق بين القيمة الفعلية والتنبؤ.

أنواع الخسارة

في الانحدار الخطي، هناك أربعة أنواع رئيسية من الخسارة، وسيتم توضيحها في الجدول التالي.

نوع الخسارة التعريف معادلة
الخسارة الأولى مجموع القيم المطلقة للفرق بين القيم المتنبأ بها والقيم الفعلية. $ ∑ | القيمة الفعلية\ - القيمة المتوقّعة | الدُّولَارُ الْأَمْرِيكِي
متوسط الخطأ المطلق (MAE) يشير ذلك المصطلح إلى متوسط عدد الخسائر في المستوى 1 ضمن مجموعة من الأمثلة. $ \frac{1}{N} ∑ | القيمة الفعلية\ - القيمة المتوقّعة | الدُّولَارُ الْأَمْرِيكِي
خسارة L2 مجموع الفرق التربيعي بين القيم المتنبأ بها والقيم الفعلية. $ ∑(القيمة\الفعلية - القيمة المتوقّعة)^2 $
متوسط الخطأ التربيعي (MSE) يشير ذلك المصطلح إلى متوسط عدد الخسائر في المستوى 2 ضمن مجموعة من الأمثلة. $ \frac{1}{N} ∑ (القيمة الفعلية\ - القيمة المتوقَّعة)^2 $

الفرق الوظيفي بين الخسارة في التربيع الأول والخسارة بالمركز 2 (أو بين MAE وMSE) تربيع. عندما يكون الفرق بين التنبؤ والتصنيف كبير، فإن التربيع يجعل الخسارة أكبر. عندما الفرق صغيرًا (أقل من 1)، فإن التربيع يجعل الخسارة أصغر.

عند معالجة أمثلة متعددة في وقت واحد، نوصي بتقدير متوسط الخسائر في جميع الأمثلة، سواء باستخدام MAE أو MSE.

مثال على حساب الخسارة

باستخدام أفضل خط مناسب السابق، فسنحسب خسارة L2 لمثال واحد. من أفضل خط مناسب، حصلنا على القيم التالية للوزن والتحيز:

  • $ \small{الوزن: -3.6} دولار أمريكي
  • $ \small{Bias: 30} $

إذا توقع النموذج أن السيارة التي وزنها 2370 رطلاً تحصل على 21.5 ميلاً لكل غالون، إلا أنه في الواقع، نحصل على 24 ميلاً لكل غالون، فسنحسب الخسارة L2 التالي:

القيمة معادلة النتيجة
التنبؤ

$\small{bias + (الوزن * الميزة\ القيمة)}$

$\small{30 + (-3.6*2.37)}$

$\small{21.5}$
القيمة الفعلية $ \small{ label } $ $ \small{ 24 } $
الخسارة 2

$ \small{ (تنبؤ - القيمة الفعلية\)^2} $

$\small{ (21.5 - 24)^2 }$

$\small{6.25}$

في هذا المثال، تبلغ نسبة الخسارة L2 لنقطة البيانات الفردية 6.25.

اختيار الخسارة

قد يعتمد تحديد ما إذا كان سيتم استخدام MAE أو MSE على مجموعة البيانات والطريقة تريد معالجة تنبؤات معينة. تتضمن معظم قيم الخصائص في مجموعة بيانات عادةً تقع ضمن نطاق متميز. على سبيل المثال، تتراوح السيارات عادةً بين عامي 2000 5000 رطل وتتراوح بين 8 إلى 50 ميلاً لكل غالون. سيارة وزنها 8000 جنيه، أو سيارة تصل مساحتها إلى 100 ميل لكل غالون، وتكون خارج النطاق المعتاد تُعتبر قيمة استثنائية.

كما يمكن أن تشير القيمة الاستثنائية إلى مدى بُعد تنبؤات النموذج عن القيمة الحقيقية القيم. على سبيل المثال، سيارة وزنها 3000 رطل أو سيارة تقطع المسافة 40 ميلاً لكل غالون ضمن النطاقات النموذجية. ومع ذلك، فإن سيارة 3000 رطل تحصل فـ 40 ميلاً لكل غالون ستكون قيمة استثنائية من حيث تنبؤ النموذج لأن النموذج سيتنبأ بأن سيارة وزنها 3000 رطل ستتراوح بين 18 20 ميلاً لكل غالون.

عند اختيار أفضل دالة الخسارة، فكّر في الطريقة التي تريد أن يتعامل بها النموذج مع النموذج والقيم المتطرفة. على سبيل المثال، يؤدي الخطأ التربيعي المتوسط (MSE) إلى تحريك النموذج باتجاه القيم الاستثنائية، في حين أنّ خوارزمية المعامل الجنوبي (MAE) لا. تنطوي الخسارة من المستوى 2 على عقوبة أعلى بكثير من القيمة الاستثنائية خسارة L1. على سبيل المثال، توضح الصور التالية نموذجًا تم تدريبه باستخدام MAE ونموذجًا تم تدريبه باستخدام MSE (الخطأ التربيعي المتوسط). ويمثل الخط الأحمر خطًا نموذج مدرَّب سيتم استخدامه لعمل التنبؤات. وتكون القيم الاستثنائية أقرب إلى تم تدريب النموذج باستخدام الخطأ التربيعي المتوسط (MSE) مقارنةً بالنموذج المُدرَّب باستخدام خوارزمية MAE.

الشكل 10. يميل النموذج أكثر نحو القيم الشاذّة.

الشكل 10. ومن خلال أيّ نموذج تم تدريبه باستخدام الخطأ التربيعي المتوسط، ننجح في تقريب النموذج من القيم الخارجية.

الشكل 11. يميل النموذج بعيدًا عن القيم الشاذّة.

الشكل 11. هناك نموذج تم تدريبه باستخدام MAE أبعد عن القيم المتطرفة.

لاحظ العلاقة بين النموذج والبيانات:

  • MSE. النموذج أقرب إلى القيم الاستثنائية ولكنه أبعد عن معظم نقاط البيانات الأخرى.

  • MAE. وهذا النموذج أبعد عن القيم الاستثنائية ولكنه أقرب إلى معظم نقاط البيانات الأخرى.

التحقّق من فهمك

بالنظر إلى المخططين التاليين:

مخطط مكون من 10 نقاط.
      يمر الخط بست نقاط. نقطتين تساوي وحدة واحدة
      فوق الخط؛ توجد نقطتان أخريان أسفل الخط وحدة واحدة. مخطط مكون من 10 نقاط. يجري خط
      إلى 8 نقاط. تساوي نقطة واحدة وحدتين
      فوق الخط؛ هناك نقطة واحدة أخرى تقع أسفل الخط وحدتين.
أي من مجموعتي البيانات الموضحتين في المخططات السابقة متوسط الخطأ التربيعي الأعلى (MSE)؟
مجموعة البيانات على اليسار.
تنطوي الأمثلة الستة على الخط على خسارة إجمالية 0. الأربعة الأمثلة غير الموجودة على الخط ليست بعيدة جدًا، لذا حتى لا يزال تربيع إزاحةها يُنتج قيمة منخفضة: $MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4 دولار
مجموعة البيانات على اليمين.
تنطوي الأمثلة الثمانية على الخط على خسارة إجمالية 0. ومع ذلك، رغم أن نقطتين فقط لا تفصلان الخط، إلا أن كلا تكون النقاط بعيدة عن الخط بمقدار مرتين مقارنةً بالنقاط الخارجية في الشكل الأيسر. تضخيم الخسارة التربيعية هذه الاختلافات، لذا فإن الخسارة من اثنين ترجع إلى خسارة أكبر بأربع مرات من التعويض واحد: $MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2} {10} = 0.8 دولار