التنازلي باستخدام تعلُّم الآلة: التراجع الخطي

لطالما اشتهر الصراصير (بنوع الحشرات) بالزناخ بمعدّل أكبر في الأيام الحارة مقارنةً بالأيام الأكثر برودة. وعلى مدار عقود، صنّف العلماء المحترفون والهواة بيانات حول زقزقة كل دقيقة ودرجة الحرارة. كهدية عيد ميلاد، تعطيك عماتك روث قاعدة بيانات للكريكيت وتطلب منك تعلّم نموذج لتوقّع هذه العلاقة. باستخدام هذه البيانات، تريد استكشاف هذه العلاقة.

أولاً، افحص بياناتك من خلال تمثيلها:

البيانات الأولية للزقاق/الدقيقة (المحور السيني) مقابل درجة الحرارة (المحور الصادي).

الشكل 1. السقاقة في الدقيقة مقابل درجة الحرارة بالدرجة المئوية.

وكما هو متوقع، تعرض الرسم البياني درجة الحرارة التي ترتفع مع عدد النقرات. هل العلاقة بين صوت زقزقة ودرجة الحرارة خطية؟ نعم، يمكنك رسم خط مستقيم واحد على النحو التالي تقريبًا:

أفضل خط يُثبّت العلاقة بين الثلاجة/الدقيقة (المحور السيني) مقابل درجة الحرارة (المحور الصادي).

الشكل 2. علاقة خطية.

صحيح، لا يمر الخط في كل نقطة، ولكنه يُظهر بوضوح العلاقة بين الزقاق ودرجة الحرارة. باستخدام معادلة الخط، يمكنك تدوين هذه العلاقة على النحو التالي:

$$ y = mx + b $$

المكان:

  • \(y\) درجة الحرارة هي مئوية، وهي القيمة التي نحاول التنبؤ بها.
  • \(m\) هو منحدر الخط.
  • \(x\) هو عدد النقرات في الدقيقة، أي قيمة ميزة الإدخال.
  • \(b\) هي نقطة التقاطع مع نقطة y.

من خلال التعلم الآلي، عليك كتابة معادلة النموذج بشكل مختلف قليلاً:

$$ y' = b + w_1x_1 $$

المكان:

  • \(y'\) هو التصنيف المتوقّع (الناتج المطلوب).
  • \(b\) هو الانحياز (التقاطع y)، ويُشار إليه أحيانًا باسم \(w_0\).
  • \(w_1\) وزن وزن الميزة 1. الوزن هو المفهوم نفسه كمثال على "النقطة":"المنحدر&السعر" \(m\) في المعادلة التقليدية للسطر.
  • \(x_1\) هي ميزة (إدخال معروف).

من أجل استنتاج درجة الحرارة \(y'\) للحصول على قيمة جديدة للدقيقة، \(x_1\)ما عليك سوى استبدال \(x_1\) القيمة في هذا النموذج.

على الرغم من أن هذا النموذج يستخدم ميزة واحدة فقط، قد يعتمد نموذج أكثر تعقيدًا على ميزات متعددة، ولكل منها وزن منفصل (\(w_1\)، \(w_2\)، إلخ). على سبيل المثال، قد يبدو النموذج الذي يعتمد على ثلاث ميزات على النحو التالي:

$$y' = b + w_1x_1 + w_2x_2 + w_3x_3$$