الانحدار الخطي: الخسارة

الخسارة هي مقياس رقمي يصف مدى خطأ التوقّعات التي يقدّمها النموذج. تقيس مقياس الخسارة المسافة بين تنبؤات النموذج والتصنيفات الفعلية. يهدف تدريب النموذج إلى تقليل الخسارة إلى أدنى قيمة ممكنة.

في الصورة التالية، يمكنك الاطّلاع على الخسارة على شكل سهام مرسومة من نقاط data تشير إلى النموذج. توضِّح الأسهم مدى تباعُد توقّعات النموذج عن القيم الفعلية.

الشكل 9. تربط خطوط الخسارة نقاط البيانات
بالنموذج.

الشكل 9. يتم قياس الخسارة من القيمة الفعلية إلى القيمة المتوقّعة.

مسافة الخسارة

في الإحصاءات والتعلم الآلي، يقيس مقياس الخسارة الفرق بين القيمة المتوقّعة والقيمة الفعلية. تركّز الخسارة على المسافة بين القيم، وليس الاتجاه. على سبيل المثال، إذا توقّع النموذج قيمة 2، ولكن القيمة الفعلية هي 5، لا يهمّنا أنّ الخسارة سالبة ‎-3 $ (‎2-5=-3 $). بدلاً من ذلك، يهمّنا أن تكون المسافة بين القيم ‎3 $. وبالتالي، تزيل كل methods لحساب الخسارة العلامة.

في ما يلي الطريقتان الأكثر شيوعًا لإزالة العلامة:

  • احسب القيمة المطلقة للفرق بين القيمة الفعلية والقيمة المتوقّعة.
  • اضرب الفرق بين القيمة الفعلية والقيمة المتوقّعة في مربعه.

أنواع الخسارة

في الانحدار الخطي، هناك أربعة أنواع رئيسية من الخسارة، وهي موضّحة في الجدول التالي.

نوع الخسارة التعريف معادلة
فقدان1 مجموع القيم المطلقة للفرق بين القيم المتوقَّعة والقيم الفعلية. ‫$ ∑ | actual\ value - predicted\ value | $
متوسط الخطأ المطلق (MAE) متوسّط خسائر L1 على مستوى مجموعة من الأمثلة ‫$ \frac{1}{N} ∑ | actual\ value - predicted\ value | $
خسارة L2 يشير ذلك المصطلح إلى مجموع الفرق التربيعي بين القيم المتوقَّعة والقيم الفعلية. $ ∑(القيمة\ الفعلية - القيمة\ المتوقّعة)^2 $
متوسط الخطأ التربيعي (MSE) متوسّط خسائر L2 على مستوى مجموعة من الأمثلة $ \frac{1}{N} ∑ (actual\ value - predicted\ value)^2 $

الفرق الوظيفي بين خسارة L1 وخسارة L2 (أو بين MAE وMSE) هو التربيع. عندما يكون الفرق بين التنبؤ والتصنيف كبيرًا، يؤدي التربيع إلى زيادة الخسارة. عندما يكون الفرق صغيرًا (أقل من 1)، يؤدي تربيعه إلى تقليل الخسارة.

عند معالجة أمثلة متعددة في الوقت نفسه، ننصحك بحساب متوسط الخسائر على مستوى جميع الأمثلة، سواء باستخدام MAE أو MSE.

مثال على احتساب الخسارة

باستخدام خط أفضل الملاءمة السابق، سنحسب خسارة L2 لمثال واحد. من خط أفضل ملاءمة، حصلنا على القيم التالية للوزن والميل:

  • $ \small{Weight: -3.6} $
  • $ \small{Bias: 30} $

إذا توقّع النموذج أنّ سيارة تزن 1,076 كيلوغرامًا تستهلك 10.7 لتر لكل 100 كيلومتر، ولكنّها تستهلك في الواقع 9.8 لتر لكل 100 كيلومتر، سنحسب خسارة L2 على النحو التالي:

.
القيمة معادلة النتيجة
التنبؤ

$\small{bias + (الوزن * الميزة\ القيمة)}$

$\small{30 + (-3.6*2.37)}$

$\small{21.5}$
القيمة الفعلية $ \small{ label } $ $ \small{ 24 } $
الخسارة 2

$ \small{ (التوقّع - القيمة الفعلية)^2} $

$\small{ (21.5 - 24)^2 }$

$\small{6.25}$

في هذا المثال، يبلغ فقدان L2 لنقطة البيانات هذه 6.25.

اختيار الخسارة

قد يعتمد تحديد ما إذا كان سيتم استخدام MAE أو MSE على مجموعة البيانات والطريقة التي تريد التعامل بها مع تنبؤات معينة. عادةً ما تقع معظم قيم السمات في مجموعة بيانات ضمن نطاق محدد. على سبيل المثال، تتراوح عادةً أسعار السيارات بين 2,000 و 5,000 جنيه إسترليني، ويكون معدّل استهلاكها للوقود بين 8 و50 ميلًا لكل جالون. إنّ السيارة التي يبلغ وزنها 8,000 رطل أو السيارة التي تقطعها 100 ميل لكل غالون تكون خارج النطاق المعتاد ويمكن اعتبارها قيمة استثنائية.

كما يمكن أن تشير القيمة الاستثنائية إلى مدى بُعد تنبؤات النموذج عن القيم الحقيقية. على سبيل المثال، سيارة تزن 3,000 رطل أو سيارة تقطع 40 ميلًا لكل جالون تقع ضمن النطاقات المعتادة. ومع ذلك، فإنّ سيارة تزن 3,000 رطل وتستهلك 40 ميلًا لكل جالون ستكون قيمة شاذة من حيث توقّعات النموذج، لأنّ النموذج سيتوقّع أن تستهلك سيارة تزن 3,000 رطل ما بين 18 و 20 ميلًا لكل جالون.

عند اختيار أفضل دالة خسارة، ضع في الاعتبار كيفية تعامل النموذج مع القيم الشاذة. على سبيل المثال، ينقل الخطأ التربيعي المتوسط النموذج بشكل أكبر نحو القيم الاستثنائية، بينما لا يحدث ذلك لخوارزمية MAE. تؤدي خسارة L2 إلى فرض عقوبة أعلى بكثير على القيم الشاذة مقارنةً بخسارة L1. على سبيل المثال، تُظهر الصور التالية نموذجًا تم تدريبه باستخدام MAE ونموذجًا تم تدريبه باستخدام الخطأ التربيعي المتوسط. يمثل الخط الأحمر نموذجًا مدربًا بالكامل سيتم استخدامه لعمل التنبؤات. القيم الشاذة أقرب إلى النموذج الذي تم تدريبه باستخدام MSE مقارنةً بالنموذج الذي تم تدريبه باستخدام MAE.

الشكل 10. يميل النموذج أكثر نحو القيم الشاذة.

الشكل 10. ومن خلال أيّ نموذج تم تدريبه باستخدام الخطأ التربيعي المتوسط، ننجح في تقريب النموذج من القيم الخارجية.

الشكل 11. يتم إمالة النموذج بعيدًا عن القيم الشاذة.

الشكل 11. يكون النموذج الذي تم تدريبه باستخدام MAE أبعد من القيم الشاذة.

لاحِظ العلاقة بين النموذج والبيانات:

  • MSE يكون النموذج أقرب إلى القيم الشاذة ولكنّه أبعد من معظم نقاط البيانات الأخرى.

  • MAE: النموذج أبعد من القيم الاستثنائية ولكنه أقرب إلى معظم نقاط البيانات الأخرى.

التحقّق من الفهم

فكِّر في الرسمَين البيانيَين التاليَين:

رسم بياني يضم 10 نقاط
      يمر خط عبر 6 من النقاط. نقطتان على ارتفاع وحدة واحدة
      فوق الخط، نقطتان أخريان على ارتفاع وحدة واحدة تحت الخط رسم بياني يضم 10 نقاط يمر خط
      عبر 8 من النقاط. تقع نقطة واحدة على بعد وحدتَين
      فوق الخط، وتقع نقطة أخرى على بعد وحدتَين تحت الخط.
أيّ من مجموعتَي البيانات المعروضتَين في الرسمَين السابقَين تحقّق أعلى قيمة لمتوسط الخطأ المربّع (MSE)؟
مجموعة البيانات على يمين الصفحة
تتسبّب الأمثلة الستة في السطر بخسارة إجمالية تبلغ 0. إنّ الأمثلة الأربعة التي لا تقع على الخط ليست بعيدة جدًا عن الخط، لذا حتى تربيع إزاحتها لا يزال ينتج قيمة منخفضة: MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$
مجموعة البيانات على اليمين
تتسبّب الأمثلة الثمانية في السطر بخسارة إجمالية تبلغ 0. مع ذلك، على الرغم من أنّ نقطتَين فقط ترسمان خارج الخط، تكون كلتا هاتين النقطتَين بعيدتَين عن الخط مرتَين مقارنةً بالنقاط الخارجية في الشكل الأيسر. تزيد الخسارة التربيعية من هذه الاختلافات، لذا يتسبّب الخسارة التربيعية بخسارة أكبر بأربع مرات تساوي قيمة إزاحة واحد: $MSE = \frac{0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2 + 0^2 + 2^2 + 0^2 + 0^2= 0.8}