تمت ترجمة هذه الصفحة بواسطة Cloud Translation API‏.

الانحدار الخطي: الخسارة

الخسارة هي مقياس رقمي يصف مدى خطأ توقّعات النموذج. تقيس الخسارة المسافة بين التوقعات التي يقدّمها النموذج والتصنيفات الفعلية. والهدف من تدريب النموذج هو تقليل الخسارة إلى أدنى قيمة ممكنة.

في الصورة التالية، يمكنك تصوّر الخسارة على شكل أسهم مرسومة من نقاط البيانات إلى النموذج. توضّح الأسهم مدى بُعد التوقّعات التي يقدّمها النموذج عن القيم الفعلية.

الشكل 8. تربط خطوط الخسارة نقاط البيانات بالنموذج.

الشكل 8 يتم قياس الخسارة من القيمة الفعلية إلى القيمة المتوقّعة.

مسافة الفقدان

في الإحصاء وتعلُّم الآلة، يقيس مقياس الخسارة الفرق بين القيم المتوقّعة والفعلية. يركّز مقياس الخسارة على المسافة بين القيم، وليس على الاتجاه. على سبيل المثال، إذا توقّع نموذج القيمة 2، لكن القيمة الفعلية كانت 5، لا يهمّنا أن تكون الخسارة سالبة (‎2-5=-3)، بل يهمّنا أن تكون المسافة بين القيمتين هي 3. وبالتالي، تزيل جميع طرق حساب الخسارة الإشارة.

في ما يلي الطريقتان الأكثر شيوعًا لإزالة العلامة:

يتم احتساب القيمة المطلقة للفرق بين القيمة الفعلية والقيمة المتوقّعة.
ربِّع الفرق بين القيمة الفعلية والقيمة المتوقّعة.

أنواع الخسائر

في الانحدار الخطي، هناك خمسة أنواع رئيسية من الخسائر، وهي موضّحة في الجدول التالي.

نوع الخسارة	التعريف	معادلة
فقدان _L1	يشير ذلك المصطلح إلى مجموع القيم المطلقة للفرق بين القيم المتوقَّعة والقيم الفعلية.	‫$ ∑ \| actual\ value - predicted\ value \| $
متوسّط الخطأ المطلق (MAE)	متوسط خسائر L₁ على مجموعة من N الأمثلة	$ \frac{1}{N} ∑ \| actual\ value - predicted\ value \| $
فقدان _L2	يشير ذلك المصطلح إلى مجموع الفَرق التربيعي بين القيم المتوقَّعة والقيم الفعلية.	$ ∑(actual\ value - predicted\ value)^2 $
الخطأ التربيعي المتوسّط (MSE)	متوسط خسائر L₂ على مجموعة من N الأمثلة	$ \frac{1}{N} ∑ (actual\ value - predicted\ value)^2 $
جذر الخطأ التربيعي المتوسّط (RMSE)	الجذر التربيعي لمتوسط الخطأ التربيعي (MSE)	$ \sqrt{\frac{1}{N} ∑ (actual\ value - predicted\ value)^2} $

الفرق الوظيفي بين خسارة L₁ وخسارة L₂ (أو بين MAE/RMSE وMSE) هو التربيع. عندما يكون الفرق بين القيمة المتوقّعة والتصنيف كبيرًا، يؤدي التربيع إلى زيادة الخسارة. عندما يكون الفرق صغيرًا (أقل من 1)، يؤدي التربيع إلى تقليل الخسارة.

قد تكون مقاييس الخسارة، مثل MAE وRMSE، أفضل من خسارة L₂ أو MSE في بعض حالات الاستخدام لأنّها تميل إلى أن تكون أكثر قابلية للتفسير من قِبل الإنسان، إذ إنّها تقيس الخطأ باستخدام المقياس نفسه الذي تستخدمه القيمة المتوقّعة للنموذج.

عند معالجة أمثلة متعددة في الوقت نفسه، ننصحك بحساب متوسط الخسائر على مستوى جميع الأمثلة، سواء كنت تستخدم MAE أو MSE أو RMSE.

مثال على احتساب الخسارة

باستخدام خط أفضل تطابق السابق، سنحسب مقياس L₂ للخطأ لمثال واحد. من خط أفضل تطابق، حصلنا على القيم التالية للوزن والانحياز:

$ \small{Weight: -4.6} $
$ \small{Bias: 34} $

إذا توقّع النموذج أنّ سيارة تزن 2,370 رطلاً ستقطع مسافة 23.1 ميلاً لكل غالون، ولكنّها في الواقع تقطع مسافة 26 ميلاً لكل غالون، سيتم حساب خسارة L₂ على النحو التالي:

القيمة	معادلة	النتيجة
التوقّع	$\small{bias + (weight * feature\ value)}$ $\small{34 + (-4.6*2.37)}$	$\small{23.1}$
القيمة الفعلية	$ \small{ label } $	$ \small{ 26 } $
خسارة ₂	$ \small{ (actual\ value - predicted\ value)^2 } $ $\small{ (26 - 23.1)^2 }$	$\small{8.41}$

القيمة

معادلة

النتيجة

التوقّع

$\small{bias + (weight * feature\ value)}$

$\small{34 + (-4.6*2.37)}$

$\small{23.1}$

القيمة الفعلية

$ \small{ label } $

$ \small{ 26 } $

خسارة ₂

$ \small{ (actual\ value - predicted\ value)^2 } $

$\small{ (26 - 23.1)^2 }$

$\small{8.41}$

في هذا المثال، تبلغ قيمة L₂ المفقودة لنقطة البيانات الفردية هذه 8.41.

اختيار خسارة

يمكن أن يعتمد قرار استخدام MAE أو MSE على مجموعة البيانات والطريقة التي تريد بها التعامل مع بعض التوقعات. عادةً ما تندرج معظم قيم الميزات في مجموعة البيانات ضمن نطاق مميّز. على سبيل المثال، يتراوح وزن السيارات عادةً بين 2,000 و5,000 رطل، وتستهلك ما بين 8 و50 ميلاً لكل غالون. إنّ سيارة تزن 8,000 رطل أو سيارة تقطع 100 ميل لكل غالون تقع خارج النطاق المعتاد، وبالتالي تُعتبر قيمة شاذة.

يمكن أن يشير الشذوذ أيضًا إلى مدى اختلاف توقّعات النموذج عن القيم الحقيقية. على سبيل المثال، يقع وزن 3,000 رطل ضمن نطاق وزن السيارة العادي، كما يقع استهلاك 40 ميلاً لكل غالون ضمن نطاق كفاءة استهلاك الوقود العادي. في المقابل، ستكون السيارة التي تزن 3,000 رطل وتستهلك 40 ميلاً لكل غالون أمثلة شاذة في ما يتعلق بتوقّعات النموذج، لأنّ النموذج سيتوقّع أنّ السيارة التي تزن 3,000 رطل ستستهلك حوالي 20 ميلاً لكل غالون.

عند اختيار أفضل دالة خسارة، يجب مراعاة الطريقة التي تريد أن يتعامل بها النموذج مع القيم الشاذة. على سبيل المثال، يؤدي MSE إلى توجيه النموذج نحو القيم الشاذة، بينما لا يؤدي MAE إلى ذلك. يؤدي فقدان L₂ إلى فرض عقوبة أكبر بكثير على القيمة الشاذة مقارنةً بفقدان L₁. على سبيل المثال، تعرض الصور التالية نموذجًا تم تدريبه باستخدام MAE ونموذجًا تم تدريبه باستخدام MSE. يمثّل الخط الأحمر نموذجًا تم تدريبه بالكامل وسيتم استخدامه لتقديم التوقعات. تكون القيم الشاذة أقرب إلى النموذج الذي تم تدريبه باستخدام متوسط الخطأ التربيعي (MSE) مقارنةً بالنموذج الذي تم تدريبه باستخدام متوسط الخطأ المطلق (MAE).

الشكل 9. يميل النموذج أكثر نحو القيم الخارجة عن النطاق الطبيعي.

الشكل 9 يؤدي فقدان MSE إلى تقريب النموذج من القيم الشاذة.

الشكل 10. يميل النموذج بعيدًا عن القيم الاستثنائية.

الشكل 10 يُبقي مقياس MAE النموذج بعيدًا عن القيم الشاذة.

لاحظ العلاقة بين النموذج والبيانات:

MSE يكون النموذج أقرب إلى القيم الشاذة وأبعد عن معظم نقاط البيانات الأخرى.
MAE يكون النموذج أبعد عن القيم الشاذة ولكنه أقرب إلى معظم نقاط البيانات الأخرى.

انقر على الرمز للحصول على مزيد من الإرشادات حول اختيار مقياس الخسارة

اختيار MSE:

إذا كنت تريد فرض عقوبة كبيرة على الأخطاء الكبيرة
إذا كنت تعتقد أنّ القيم الشاذة مهمة وتشير إلى تباين حقيقي في البيانات يجب أن يأخذه النموذج في الاعتبار

اختيار MAE:

إذا كانت مجموعة البيانات تتضمّن قيمًا متطرفة كبيرة لا تريد أن تؤثّر بشكل مفرط في النموذج. MAE أكثر فعالية.
إذا كنت تفضّل دالة خسارة يمكن تفسيرها بشكل مباشر على أنّها متوسط مقدار الخطأ.

في الواقع، يمكن أن يعتمد اختيار المقياس أيضًا على المشكلة التجارية المحدّدة ونوع الأخطاء الأكثر تكلفة.

التحقّق من فهمك

لنفترض أنّ لديك المخططَين التاليَين لنموذج خطي ملائم لمجموعة بيانات:

رسم بياني يضم 10 نقاط
يمر خط مستقيم بـ 6 نقاط. تكون نقطتان على بُعد وحدة واحدة
فوق الخط، وتكون نقطتان أخريان على بُعد وحدة واحدة تحت الخط.

رسم بياني يضم 10 نقاط يمر خط
بـ 8 نقاط. تقع نقطة واحدة على بُعد وحدتَين فوق الخط، وتقع نقطة أخرى على بُعد وحدتَين تحت الخط.

أيّ من النموذجين الخطيين الموضّحين في الرسومات البيانية السابقة لديه متوسط خطأ تربيعي أعلى عند تقييمه على نقاط البيانات الموضّحة؟

النموذج على اليمين

تتسبّب الأمثلة الستة في السطر في خسارة إجمالية قدرها 0. الأمثلة الأربعة التي لا تقع على الخط ليست بعيدة جدًا عنه، لذا حتى إذا تم تربيع قيمة الإزاحة، ستظل القيمة منخفضة: $MSE = \frac{0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 1^2 + 0^2 + 0^2} {10} = 0.4$