الملخّص
تناولت هذه الدورة العديد من الفخاخ الشائعة للبيانات، بدءًا من جودة مجموعة البيانات
إلى التفكير في التصور والتحليل الإحصائي.
يجب أن يطرح ممارسو تعلُّم الآلة الأسئلة التالية:
- ما مدى فهمي لخصائص مجموعات البيانات
الظروف التي تم بموجبها جمع تلك البيانات؟
- ما هي مشاكل الجودة أو الانحياز الموجودة في بياناتي؟ تُعد عوامل مربكة
حاليًا؟
- ما المشكلات المحتملة التي قد تنشأ عن استخدام هذه
لمجموعات البيانات؟
- عند تدريب نموذج يقدم تنبؤات أو تصنيفات:
التي يتم تطبيق النموذج عليها وتحتوي على جميع المتغيرات ذات الصلة؟
ومهما كانت النتائج التي توصلوا إليها، يجب على ممارسي التعلم الآلي فحص
أنفسهم بحثًا عن التحيز التأكيدي، ثم تتحقق من نتائجهم مقابل
الحدس والحس السليم، والتحقيق في أي مكان تكون فيه البيانات متعارضة
معهم.
موادّ إضافية للقراءة
القاهرة، ألبرتو. كيف تكمن المخططات: تعزيز ذكاء المعلومات المرئية؟ نيويورك:
دبليو. دبليو Norton، 2019
هوف، داريل. كيفية التعامل مع الإحصاءات نيويورك: دبليو. دبليو نورتون، 1954.
مونمونير، مارك. كيفية الاستلقاء مع خرائط Google، الإصدار الثالث شيكاغو: U of Chicago P، 2018
جونز، بن. تجنُّب مخاطر البيانات: هوبوكين، نيو جيرسي: وايلي، 2020.
ويلان، تشارلز. الإحصاءات المجردة: إزالة الخوف من البيانات نيويورك:
دبليو. دبليو نورتون، 2013
إنّ محتوى هذه الصفحة مرخّص بموجب ترخيص Creative Commons Attribution 4.0 ما لم يُنصّ على خلاف ذلك، ونماذج الرموز مرخّصة بموجب ترخيص Apache 2.0. للاطّلاع على التفاصيل، يُرجى مراجعة سياسات موقع Google Developers. إنّ Java هي علامة تجارية مسجَّلة لشركة Oracle و/أو شركائها التابعين.
تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)
[null,null,["تاريخ التعديل الأخير: 2024-07-26 (حسب التوقيت العالمي المتفَّق عليه)"],[[["This course explores common data traps encountered in machine learning, encompassing dataset quality, thinking processes, visualization, and statistical analysis."],["Machine learning practitioners must critically assess their datasets, identifying potential biases, confounding factors, and downstream issues arising from data usage."],["Thoroughly understanding data characteristics and collection conditions is crucial for mitigating data pitfalls and ensuring robust machine learning models."],["Confirmation bias should be actively addressed, and data findings should be validated against intuition and common sense, prompting further investigation where discrepancies exist."],["Further insights into data analysis and interpretation can be gained from the listed additional reading materials covering topics like chart interpretation, statistical manipulation, and map-based data representation."]]],[]]