الانحدار الخطّي

تعرِض هذه الوحدة مفاهيم الانحدار الخطي.

الانحدار الخطي هو أحد الأساليب الإحصائية التي تُستخدَم لمعرفة العلاقة بين المتغيّرات. في سياق التعلم الآلي، يحدِّد الانحدار الخطي العلاقة بين السمات وأحد التصنيفات.

على سبيل المثال، لنفترض أنّنا نريد توقّع كفاءة استهلاك الوقود في السيارة بالميل لكل غالون استنادًا إلى وزن السيارة، ولدينا مجموعة البيانات التالية:

الجنيهات بالآلاف (ميزة) ميل لكل غالون (تصنيف)
3.5 18
3.69 15
3.44 18
3.43 16
4.34 15
4.42 14
2.37 24

إذا رسمنا هذه النقاط، سنحصل على الرسم البياني التالي:

الشكل 1. نقاط بيانات تعرِض مؤشرًا متّجهًا للأسفل من اليسار إلى اليمين

الشكل 1: وزن السيارة (بالرطل) مقارنةً بتقييم الأميال لكل غالون كلما زاد وزن السيارة، انخفض معدّل استهلاكها للوقود بشكل عام.

يمكننا إنشاء نموذجنا الخاص من خلال رسم خط أقرب إلى النقاط:

الشكل 2.  نقاط البيانات التي تم رسم خط الأنسب من خلالها لتمثيل النموذج

الشكل 2: خط الأنسب الذي تم رسمه من خلال البيانات الواردة في الشكل السابق

معادلة الانحدار الخطي

في المصطلحات الجبرية، سيتم تعريف النموذج على النحو التالي: $ y = mx + b $، حيث

  • ‫$ y $ هي المسافة التي يقطعها مركبة في غالون واحد من الوقود، وهي القيمة التي نريد التنبؤ بها.
  • $ m $ هو ميل الخط.
  • ‫$ x $ هي الجنيهات، وهي قيمة الإدخال.
  • $ b $ هي نقطة التقاطع مع المحور العمودي y.

في تعلُّم الآلة، نكتب معادلة نموذج الانحدار الخطي على النحو التالي:

$$ y' = b + w_1x_1 $$

حيث:

  • $ y' $ هو التصنيف المتوقّع، أي الناتج.
  • يمثّل المتغيّر $ b $ التحيز للنموذج. ويُعدّ الانحياز هو نفسه مفهوم نقطة تقاطع y في معادلة الخطّ الجبرية. في تعلُّم الآلة، يُشار أحيانًا إلى الانحياز باسم $ w_0 $. والانحياز هو مَعلمة للنموذج ويتم احتسابه أثناء التدريب.
  • ‫$ w_1 $ هو الوزن للميزة. الوزن هو المفهوم نفسه للميل $ m $ في معادلة الخطّ الجبرية. "الوزن" هو أحد المَعلمات في النموذج ويتم محاسبته أثناء التدريب.
  • $ x_1 $ هو سمة، وهي المدخل.

أثناء التدريب، يحتسِب النموذج الوزن والانحياز اللذَين ينتج عنهما أفضل نموذج.

الشكل 3. المعادلة y' = b + w1x1، مع تعليق توضيحي لكل مكوّن يوضّح الغرض منه

الشكل 3 التمثيل الرياضي لنموذج خطي

في مثالنا، سنحسب الوزن والانحياز من الخط الذي رسمناه. ‎"التحيز" هو 30 (حيث يتقاطع الخط مع المحور ص)، و"الوزن" هو -3.6 (‎"منحدر" الخط). سيتم تعريف النموذج على النحو التالي: y' = 30 + (-3.6)(x_1)، ويمكننا استخدامه لإجراء توقّعات. على سبيل المثال، باستخدام هذا النموذج، ستكون كفاءة الوقود المتوقّعة لسيارة تزن 4,000 رطل (1,814 كيلوغرام) هي 15.6 ميل (25.2 كيلومتر) لكل غالون.

الشكل 4.  الرسم البياني نفسه في الشكل 2، مع تمييز النقطة (4، 15.6).

الشكل 4 باستخدام النموذج، تبلغ كفاءة استهلاك الوقود المتوقّعة لسيارة تزن 4, 000 رطل (1,814 كغ) 15.6 ميل لكل جالون أمريكي (16.3 كيلومتر لكل لتر).

النماذج التي تتضمّن ميزات متعددة

على الرغم من أنّ المثال في هذا القسم يستخدم سمة واحدة فقط، وهي ثقل السيارة، قد يعتمد نموذج أكثر تعقيدًا على سمات متعددة، لكل منها وزن منفصل ($ w_1 $ و$ w_2 $ وما إلى ذلك). على سبيل المثال، يمكن كتابة نموذج يعتمد على خمس ميزات على النحو التالي:

$ y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $

على سبيل المثال، يمكن أن يستخدم النموذج الذي يتوقّع معدّل استهلاك الوقود أيضًا ميزات إضافية، مثل ما يلي:

  • سعة المحرك
  • التسارع
  • عدد الأسطوانات
  • القدرة الحصانية

سيتم كتابة هذا النموذج على النحو التالي:

الشكل 5.  معادلة الانحدار الخطي التي تتضمّن خمس ميزات

الشكل 5 نموذج يتضمّن خمس ميزات للتنبؤ بتقييم استهلاك السيارة للوقود بالميل لكل جالون

من خلال إنشاء رسم بياني لبعض هذه الميزات الإضافية، يمكننا ملاحظة أنّ لها أيضًا علاقة خطية بالعنوان، أي عدد الأميال التي يقطعها غالون الوقود:

الشكل 6 سعة المحرك بالسنتيمتر المكعب موضَّحة في الرسم البياني مقابل الأميال لكل جالون، ما يشير إلى علاقة خطية سلبية.

الشكل 6 حجم محرك السيارة بالسنتمتر المكعب وعدد الأميال التي تقطعها السيارة بالغالون كلما زاد حجم محرك السيارة، انخفض معدّل الأميال التي تقطعها السيارة لكلّ جالون بشكل عام.

الشكل 7 تسارع من صفر إلى ستين ثانية في ثوانٍ مرسومًا بيانيًا مقابل أميال لكل جالون يعرض علاقة خطية إيجابية

الشكل 7 تسارع السيارة واستهلاكها للوقود كلما استغرقت عملية تسارع السيارة وقتًا أطول، زاد معدّل استهلاك الوقود بشكل عام.

الشكل 8 رسم بياني لقوة حصان مقابل عدد الأميال لكل جالون يعرض علاقة خطية سلبية

الشكل 8 قدرة السيارة الحصانية واستهلاكها للوقود كلما زادت قوة حصان السيارة، انخفض معدّل الأميال لكل جالون بشكل عام.

تمرين: التحقّق من فهمك

ما هي أجزاء معادلة الانحدار الخطي التي يتم تعديلها أثناء التدريب؟
التدرّج والقيم المُقدَّرة
أثناء التدريب، يعدّل النموذج الانحياز والأوزان.
التوقّع
لا يتم تعديل التوقّعات أثناء التدريب.
قيم العناصر
قيم السمات هي جزء من مجموعة البيانات، لذا لا يتم تعديلها أثناء التدريب.