اختبار الفهم

تساعدك الأسئلة التالية على ترسيخ فهمك لمفاهيم تعلُّم الآلة الأساسية.

القدرة التنبؤية

يتم تدريب نماذج تعلُّم الآلة الخاضعة للإشراف باستخدام مجموعات بيانات تتضمّن أمثلة مصنَّفة. يتعلم النموذج كيفية التنبؤ بالتسمية من الميزات. ومع ذلك، ليس كل ميزة في مجموعة البيانات لها قوة تنبؤية. في بعض الحالات، تعمل عدد قليل فقط من الميزات كتنبؤات للتسمية. في مجموعة البيانات أدناه، استخدم السعر كتسمية والأعمدة المتبقية كميزات.

مثال مُصنَّف لسمات السيارات.

ما الميزات الثلاث التي تعتقد أنها من المحتمل أن تكون أكبر المؤشرات لسعر السيارة؟
Make_model، السنة، الأميال.
من بين أقوى المؤشرات لسعرها، من المرجح أن تكون العلامة التجارية والطراز وسنة السيارة وأميالها من بين أقوى المؤشرات.
اللون والارتفاع make_model.
لا يعتبر طول السيارة ولونها مؤشرين قويين لسعر السيارة.
ميل، صندوق التروس، make_model.
صندوق التروس ليس مؤشرًا رئيسيًا للسعر.
Tire_size, wheel_base, year.
لا يعتبر حجم الإطار وقاعدة العجلات مؤثرين قويين لسعر السيارة.

التعلُّم الخاضع للإشراف وغير الخاضع للإشراف

بناءً على المشكلة، سوف تستخدم إما نهجًا خاضعًا للإشراف أو غير خاضع للإشراف. فعلى سبيل المثال، إذا كنت تعرف مسبقًا القيمة أو الفئة التي تريد التنبؤ بها، يمكنك استخدام التعلم المُوجّه. ومع ذلك، إذا أردت معرفة ما إذا كانت مجموعة البيانات لديك تحتوي على أي تصنيفات أو مجموعات من الأمثلة ذات الصلة، فننصحك باستخدام التعلم غير الخاضع للإشراف.

افترض أن لديك مجموعة بيانات للمستخدمين لموقع ويب للتسوق عبر الإنترنت، وكانت تحتوي على الأعمدة التالية:

صورة لصف من سمات العملاء

إذا كنت تريد فهم أنواع المستخدمين الذين يزورون الموقع، هل ستستخدم التعلم المُوجّه أو غير المُوجّه؟
التعلم غير المُوجّه.
وبما أنّنا نريد أن يجمّع النموذج مجموعات من العملاء ذوي الصلة، سنستخدم التعلُّم غير الخاضع للإشراف. بعد أن يجمع النموذج المستخدمين في مجموعات، ننشئ أسماء خاصة بنا لكل مجموعة، على سبيل المثال "الباحثون عن تخفيضات" و"صائدو الصفقات" و"راكبو الأمواج" و"الوفيون" و"الهواة".
التعلُّم الخاضع للإشراف لأنّني أحاول توقّع الفئة التي ينتمي إليها المستخدم.
في التعلّم المُوجّه، يجب أن تحتوي مجموعة البيانات على التصنيف الذي تحاول التنبؤ به. وفي مجموعة البيانات، لا يوجد تصنيف يشير إلى فئة من المستخدمين.

افترض أن لديك مجموعة بيانات استخدام الطاقة للمنازل ذات الأعمدة التالية:

صورة لصف من سمات المنزل

ما هو نوع تقنية تعلُّم الآلة الذي ستستخدمه لتوقّع ساعات الكيلوواط المستخدمة سنويًا لمنزل تم بناؤه حديثًا؟
التعلُّم الخاضع للإشراف
يتدرب التعلُّم المُوجّه على الأمثلة المصنّفة. في مجموعة البيانات هذه، يكون "الكيلوواط ساعة المستخدمة في السنة" هو التصنيف لأنّ هذه هي القيمة التي تريد أن يتوقّعها النموذج. ستكون الميزات "المساحة المربعة" و"الموقع" و"سنة الإنشاء".
التعلم غير المُوجّه.
يستخدم التعلم غير المُوجه أمثلة غير مُصنفة. في هذا المثال، سيكون "الكيلوواط ساعة المستخدمة في السنة" هو التصنيف لأنّ هذه هي القيمة التي تريد أن يتوقّعها النموذج.

افترض أن لديك مجموعة بيانات رحلة بها الأعمدة التالية:

صورة لصف من بيانات الرحلات الجوية

إذا أردت توقّع تكلفة تذكرة المدرب، هل ستستخدم الانحدار أو التصنيف؟
الانحدار
ناتج نموذج الانحدار هو قيمة عددية.
التصنيف
ناتج نموذج التصنيف هو قيمة منفصلة، تكون عادةً كلمة. في هذه الحالة، تكون تكلفة تذكرة الحافلة قيمة رقمية.
واستنادًا إلى مجموعة البيانات، هل يمكنك تدريب نموذج تصنيف لتصنيف تكلفة تذكرة الحافلة على أنها "مرتفعة" أو "متوسطة" أو "منخفضة"؟
نعم، لكننا نحتاج أولاً إلى تحويل القيم الرقمية في عمود coach_ticket_cost إلى قيم فئوية.
يمكن إنشاء نموذج تصنيف من مجموعة البيانات. يمكنك تنفيذ إجراء مثل ما يلي:
  1. ابحث عن متوسط تكلفة تذكرة من مطار المغادرة إلى مطار الوجهة.
  2. حدِّد الحدود التي قد تكون "مرتفعة" و"متوسطة" و "منخفضة".
  3. قارِن التكلفة المتوقّعة بالحدود الدنيا واعرض الفئة التي تندرج ضمنها القيمة.
كلا، لا يمكن إنشاء نموذج تصنيف. القيمتان coach_ticket_cost رقمية وليست فئوية.
مع بذل مجهود بسيط، يمكنك إنشاء نموذج تصنيف.
لا، لأنّ نماذج التصنيف تتوقّع فئتَين فقط، مثل spam أو not_spam. يجب أن يتوقّع هذا النموذج ثلاث فئات.
يمكن لنماذج التصنيف التنبؤ بفئات متعددة. ويُطلق عليها اسم نماذج التصنيف متعددة الفئات.

التدريب والتقييم

بعد تطبيق أحد النماذج، نقيّمه باستخدام مجموعة بيانات تشتمل على أمثلة مُصنّفة، ونقارن قيمة النموذج المتنبأ بها بالقيمة الفعلية للتصنيف.

حدد أفضل إجابتين عن السؤال.

إذا كانت تنبؤات النموذج بعيدة، فما الذي يمكنك فعله لتحسينها؟
أعد تدريب النموذج، لكن استخدم فقط الميزات التي تعتقد أنها لديها أقوى قوة تنبؤية للتصنيف.
ويمكن أن تؤدي إعادة تدريب النموذج باستخدام ميزات أقل، مع أنها تتمتع بقدر أكبر من القدرة التنبؤية، إلى إنشاء نموذج يقدم تنبؤات أفضل.
لا يمكنك إصلاح نموذج بعيدة عن التوقّعات.
من الممكن إصلاح نموذج تكون تنبؤاته غير مفعّلة. تتطلب معظم النماذج جولات متعددة من التدريب حتى تقدم تنبؤات مفيدة.
إعادة تدريب النموذج باستخدام مجموعة بيانات أكبر وأكثر تنوعًا.
يمكن للنماذج المدربة على مجموعات البيانات التي تضم المزيد من الأمثلة ومجموعة أكبر من القيم أن تنتج تنبؤات أفضل لأن النموذج يحتوي على حل معمم أفضل للعلاقة بين الميزات والتصنيف.
جرّب منهج تدريب مختلف. على سبيل المثال، إذا استخدمت نهجًا خاضعًا للإشراف، فجرب أسلوبًا غير خاضع للإشراف.
نهج التدريب المختلف لن يوفر تنبؤات أفضل.

أنت الآن جاهز لاتّخاذ الخطوة التالية في رحلتك في تعلُّم الآلة: