سنطرح نسخة جديدة ومحسّنة من دورة Crash Course في آب (أغسطس) 2024. يمكنك متابعتنا لمعرفة أيّ جديد!
تجاوز العبور؟
قبل مشاهدة الفيديو أو قراءة الوثائق، يرجى إكمال هذا
التمرين الذي يستكشف الإفراط في استخدام روابط الميزات.
المهمة 1: شغّل النموذج كما هو، مع كل الميزات عبر المنتجات المحددة. هل هناك أي مفاجآت في طريقة تناسب النموذج مع البيانات؟
ما المشكلة؟
المهمة 2: حاول إزالة الميزات المتنوعة على مستوى المنتجات لتحسين الأداء (إن كان ذلك بشكل طفيف). لماذا قد تؤدي إزالة الميزات
إلى تحسين الأداء؟
(تظهر الإجابات أسفل التمرين مباشرةً.)
انقر فوق أيقونة علامة الجمع للإجابة على المهمة 1.
المستغرب، أن حدود قرار النموذج تبدو سخية إلى حد ما. على وجه الخصوص،
هناك منطقة في أعلى اليسار تشير إلى اللون الأزرق، على الرغم من
عدم وجود دعم مرئي لذلك في البيانات.
لاحظ السُمك النسبي للخطوط الخمسة التي تعمل من INPUT إلى OUTPUT.
تعرض هذه الخطوط الأوزان النسبية للميزات الخمسة.
تكون الخطوط الصادرة من X 1 وX2 أكثر سمكًا من الخطوط الصادرة من علامات التقاطع المتّبَعة في الخصائص. لذا، فإن نقاط التقاطع الخاصة بالميزة تساهم في النموذج أقل بكثير من الميزات العادية (غير المتقاطعة).
انقر فوق أيقونة علامة الجمع للإجابة على المهمة 2.
تؤدي إزالة جميع تقاطعات الخصائص إلى إنشاء نموذج معقول أكثر (لم يعد هناك حدود منحنية توحي بالإفراط في التوافق)، وتجعل قيمة خسارة الاختبار تتقارب.
بعد 1000 تكرار، ينبغي أن تكون نسبة الخسارة في الاختبار أقل قليلاً من القيمة التي كانت عليها عندما كان هناك تداخل للميزة (على الرغم من أن النتائج قد تختلف قليلاً، اعتمادًا على مجموعة البيانات).
البيانات الواردة في هذا التمرين هي في الأساس بيانات خطية بالإضافة إلى التشويش.
إذا استخدمنا نموذجًا معقدًا للغاية، مثل نموذج به عدد كبير جدًا من التقاطعات، فإننا نمنحه الفرصة ليتوافق مع تشويش بيانات التدريب،
غالبًا على حساب التأثير السيئ للنموذج في بيانات الاختبار.