مجموعات البيانات والتعميم والإفراط في التوافق

مقدمة

تبدأ هذه الوحدة بسؤال توجيهي. اختَر إحدى الإجابات التالية:

إذا كان عليك إعطاء الأولوية لتحسين أحد المجالات التالية في مشروع التعلم الآلي لديك، والتي من شأنها أن تضم أكثر التأثير؟
تحسين جودة مجموعة البيانات
البيانات أهم من الكل. إن جودة وحجم مجموعة البيانات مهمة أكثر بكثير الخاصة بك التي تستخدمها لبناء نموذجك.
تطبيق دالة الخسارة بشكل أكثر ذكاءً لتدريب نموذجك
صحيح، يمكن لدالة الخسارة الأفضل أن تساعد في تطبيق النموذج بشكل أسرع، إلا أنه لا يزال يفصلك عن عنصر آخر في هذه القائمة.

إليك سؤال توجيهي أكثر:

تخمن: كم من الوقت في مشروع التعلم الآلي لديك هل تقضي عادةً على إعداد البيانات وتحويلها؟
أكثر من نصف وقت المشروع
نعم، يقضي ممارسو تعلُّم الآلة معظم وقتهم وإنشاء مجموعات البيانات والقيام بهندسة الخصائص.
أقل من نصف وقت المشروع
التخطيط لمزيد من المهام فعادةً ما يستخدم التعلم الآلي 80% من الوقت المشروع في إنشاء مجموعات البيانات وتحويل البيانات.

في هذه الوحدة، ستتعرف على المزيد من المعلومات عن خصائص التعلم الآلي مجموعات البيانات وكيفية إعداد بياناتك لضمان الحصول على نتائج عالية الجودة عند لتطبيق نموذجك وتقييمه.