تناولت هذه الدورة العديد من الفخاخ الشائعة للبيانات، بدءًا من جودة مجموعة البيانات إلى التفكير في التصور والتحليل الإحصائي.
يجب أن يطرح ممارسو تعلُّم الآلة الأسئلة التالية:
- ما مدى فهمي لخصائص مجموعات البيانات الظروف التي تم بموجبها جمع تلك البيانات؟
- ما هي مشاكل الجودة أو الانحياز الموجودة في بياناتي؟ تُعد عوامل مربكة حاليًا؟
- ما المشكلات المحتملة التي قد تنشأ عن استخدام هذه لمجموعات البيانات؟
- عند تدريب نموذج يقدم تنبؤات أو تصنيفات: التي يتم تطبيق النموذج عليها وتحتوي على جميع المتغيرات ذات الصلة؟
ومهما كانت النتائج التي توصلوا إليها، يجب على ممارسي التعلم الآلي فحص أنفسهم بحثًا عن التحيز التأكيدي، ثم تتحقق من نتائجهم مقابل الحدس والحس السليم، والتحقيق في أي مكان تكون فيه البيانات متعارضة معهم.
موادّ إضافية للقراءة
القاهرة، ألبرتو. كيف تكمن المخططات: تعزيز ذكاء المعلومات المرئية؟ نيويورك: دبليو. دبليو Norton، 2019
هوف، داريل. كيفية التعامل مع الإحصاءات نيويورك: دبليو. دبليو نورتون، 1954.
مونمونير، مارك. كيفية الاستلقاء مع خرائط Google، الإصدار الثالث شيكاغو: U of Chicago P، 2018
جونز، بن. تجنُّب مخاطر البيانات: هوبوكين، نيو جيرسي: وايلي، 2020.
ويلان، تشارلز. الإحصاءات المجردة: إزالة الخوف من البيانات نيويورك: دبليو. دبليو نورتون، 2013