تعرِض هذه الوحدة مفاهيم الانحدار الخطي.
الانحدار الخطي هو أحد الأساليب الإحصائية التي تُستخدَم لمعرفة العلاقة بين المتغيّرات. في سياق التعلم الآلي، يحدِّد الانحدار الخطي العلاقة بين السمات وأحد التصنيفات.
على سبيل المثال، لنفترض أنّنا نريد توقّع كفاءة استهلاك الوقود في السيارة بالميل لكل غالون استنادًا إلى وزن السيارة، ولدينا مجموعة البيانات التالية:
الجنيهات بالآلاف (ميزة) | ميل لكل غالون (تصنيف) |
---|---|
3.5 | 18 |
3.69 | 15 |
3.44 | 18 |
3.43 | 16 |
4.34 | 15 |
4.42 | 14 |
2.37 | 24 |
إذا رسمنا هذه النقاط، سنحصل على الرسم البياني التالي:
الشكل 1: وزن السيارة (بالرطل) مقارنةً بتقييم الأميال لكل غالون كلما زاد وزن السيارة، انخفض معدّل استهلاكها للوقود بشكل عام.
يمكننا إنشاء نموذجنا الخاص من خلال رسم خط أقرب إلى النقاط:
الشكل 2: خط الأنسب الذي تم رسمه من خلال البيانات الواردة في الشكل السابق
معادلة الانحدار الخطي
في المصطلحات الجبرية، سيتم تعريف النموذج على النحو التالي: $ y = mx + b $، حيث
- $ y $ هي المسافة التي يقطعها مركبة في غالون واحد من الوقود، وهي القيمة التي نريد التنبؤ بها.
- $ m $ هو ميل الخط.
- $ x $ هي الجنيهات، وهي قيمة الإدخال.
- $ b $ هي نقطة التقاطع مع المحور العمودي y.
في تعلُّم الآلة، نكتب معادلة نموذج الانحدار الخطي على النحو التالي:
حيث:
- $ y' $ هو التصنيف المتوقّع، أي الناتج.
- يمثّل المتغيّر $ b $ التحيز للنموذج. ويُعدّ الانحياز هو نفسه مفهوم نقطة تقاطع y في معادلة الخطّ الجبرية. في تعلُّم الآلة، يُشار أحيانًا إلى الانحياز باسم $ w_0 $. والانحياز هو مَعلمة للنموذج ويتم احتسابه أثناء التدريب.
- $ w_1 $ هو الوزن للميزة. الوزن هو المفهوم نفسه للميل $ m $ في معادلة الخطّ الجبرية. "الوزن" هو أحد المَعلمات في النموذج ويتم محاسبته أثناء التدريب.
- $ x_1 $ هو سمة، وهي المدخل.
أثناء التدريب، يحتسِب النموذج الوزن والانحياز اللذَين ينتج عنهما أفضل نموذج.
الشكل 3 التمثيل الرياضي لنموذج خطي
في مثالنا، سنحسب الوزن والانحياز من الخط الذي رسمناه. "التحيز" هو 30 (حيث يتقاطع الخط مع المحور ص)، و"الوزن" هو -3.6 ("منحدر" الخط). سيتم تعريف النموذج على النحو التالي: y' = 30 + (-3.6)(x_1)، ويمكننا استخدامه لإجراء توقّعات. على سبيل المثال، باستخدام هذا النموذج، ستكون كفاءة الوقود المتوقّعة لسيارة تزن 4,000 رطل (1,814 كيلوغرام) هي 15.6 ميل (25.2 كيلومتر) لكل غالون.
الشكل 4 باستخدام النموذج، تبلغ كفاءة استهلاك الوقود المتوقّعة لسيارة تزن 4, 000 رطل (1,814 كغ) 15.6 ميل لكل جالون أمريكي (16.3 كيلومتر لكل لتر).
النماذج التي تتضمّن ميزات متعددة
على الرغم من أنّ المثال في هذا القسم يستخدم سمة واحدة فقط، وهي ثقل السيارة، قد يعتمد نموذج أكثر تعقيدًا على سمات متعددة، لكل منها وزن منفصل ($ w_1 $ و$ w_2 $ وما إلى ذلك). على سبيل المثال، يمكن كتابة نموذج يعتمد على خمس ميزات على النحو التالي:
$ y' = b + w_1x_1 + w_2x_2 + w_3x_3 + w_4x_4 + w_5x_5 $
على سبيل المثال، يمكن أن يستخدم النموذج الذي يتوقّع معدّل استهلاك الوقود أيضًا ميزات إضافية، مثل ما يلي:
- سعة المحرك
- التسارع
- عدد الأسطوانات
- القدرة الحصانية
سيتم كتابة هذا النموذج على النحو التالي:
الشكل 5 نموذج يتضمّن خمس ميزات للتنبؤ بتقييم استهلاك السيارة للوقود بالميل لكل جالون
من خلال إنشاء رسم بياني لبعض هذه الميزات الإضافية، يمكننا ملاحظة أنّ لها أيضًا علاقة خطية بالعنوان، أي عدد الأميال التي يقطعها غالون الوقود:
الشكل 6 حجم محرك السيارة بالسنتمتر المكعب وعدد الأميال التي تقطعها السيارة بالغالون كلما زاد حجم محرك السيارة، انخفض معدّل الأميال التي تقطعها السيارة لكلّ جالون بشكل عام.
الشكل 7 تسارع السيارة واستهلاكها للوقود كلما استغرقت عملية تسارع السيارة وقتًا أطول، زاد معدّل استهلاك الوقود بشكل عام.
الشكل 8 قدرة السيارة الحصانية واستهلاكها للوقود كلما زادت قوة حصان السيارة، انخفض معدّل الأميال لكل جالون بشكل عام.