عملية إعداد البيانات وهندسة الميزات

ما هي العملية المتّبعة؟

كما ذكرنا سابقًا، تركّز هذه الدورة التدريبية على إنشاء مجموعة البيانات وتحويل بياناتك.

تتألف عملية إنشاء مجموعة بياناتك من المهام التالية: 1. جمع البيانات الأولية  2- تحديد مصادر الميزات والتصنيفات 3- اختَر استراتيجية لأخذ العينات.
4. تقسيم البيانات يتألف تحويل البيانات من المهام التالية:
1. يمكنك استكشاف بياناتك وتنقيحها. 2- تنفيذ هندسة
الميزات.

معلومات مهمة:

  • ويعرض الشكل عملية عادية، وقد لا تكون مثالية لكل مشروع. تنطبق هذه الدورة التدريبية بشكل أساسي على الانحدار الخطّي والشبكات العصبية.
  • العملية المعروضة ليست تسلسلية دائمًا. على سبيل المثال، يمكنك تقسيم بياناتك بعد تحويلها. قد تحتاج إلى جمع المزيد من البيانات. قد تحتاج إلى تعديل مجموعة الميزات حتى بعد بدء التدريب.

كم من الوقت يستغرق هذا الأمر؟

بالنسبة إلى السؤال التالي، انقر على السهم المطلوب للاطّلاع على إجابتك:

تخمين: في مشروع تعلُّم الآلة، ما المدة التي ستقضيها عادةً في إعداد البيانات وتحويلها؟
أكثر من نصف وقت المشروع
صحيح: ستقضي معظم الوقت في مشروع تعلُّم الآلة لإنشاء مجموعات بيانات وتحويل البيانات.
أقل من نصف وقت المشروع
خطِّط للمزيد. عادةً ما يتم تخصيص 80% من الوقت في مشروع تعلُّم الآلة لإنشاء مجموعات بيانات وتحويل البيانات.