الإنصاف: اختبر معلوماتك

  1. صواب أم خطأ: يحدث التحيز التاريخي عندما يتم تدريب نموذج على بيانات قديمة.

  2. يدرّب المهندسون نموذج الانحدار على توقُّع محتوى السعرات الحرارية في الوجبات استنادًا إلى مجموعة من بيانات الميزات التي استخلصوها من المواقع الإلكترونية لوصفات الطعام حول العالم، بما في ذلك حجم الوجبة والمكوّنات وأساليب التحضير. أي من مشكلات البيانات التالية هي مصادر محتملة للتحيز يجب التحقيق فيها بشكل أكبر؟

    يُرجى اختيار كل ما ينطبق.

  3. تم تدريب نموذج رصد السخرية على 80,000 رسالة نصية: 40,000 رسالة أرسلها بالغون (18 عامًا أو أكثر) و40,000 رسالة أرسلها قاصرون (أقل من 18 عامًا). ثم تم تقييم النموذج من خلال مجموعة اختبار تتألف من 20,000 رسالة: 10,000 من البالغين و10,000 من القاصرين. توضح مصفوفات الالتباس التالية نتائج كل مجموعة (يشير التنبؤ الإيجابي إلى تصنيف "ساخر"؛ والتنبؤ السلبي يشير إلى تصنيف "غير ساخر"):

    الأشخاص البالغون

    الإيجابيات الصحيحة (TPs): 512 القيم الإيجابية الكاذبة (FP): 51
    الأرقام السلبية الخاطئة: 36 السلبية الصواب (TN): 9401
    الدقة = TP/(TP + FP) = 0.909
    الاستدعاء = TP/(TP + FN) = 0.934

    القاصرون

    الإيجابيات الصحيحة (TPs): 2147 القيم الإيجابية الكاذبة (FP): 96
    الأرقام السلبية الخاطئة: 2177 المعايير السلبية الصحيحة: 5,580
    الدقة = TP/(TP + FP) = 0.957
    الاستدعاء = TP/(TP + FN) = 0.497

    أي عبارة (عبارات) مما يلي يعد صحيحًا بشأن أداء مجموعة الاختبار للنموذج؟

    يُرجى اختيار كل ما ينطبق.

  4. أي من الفرضيات التالية يمكن أن يفسر التناقضات في أداء المجموعة الفرعية في مجموعة الاختبار لنموذج الكشف عن السخرية أعلاه؟

    يُرجى اختيار كل ما ينطبق.

  5. يعمل المهندسون على إعادة تدريب نموذج السخرية أعلاه لمعالجة التناقضات في دقة اكتشاف السخرية عبر الفئات الديموغرافية للأعمار، ولكن تم طرح النموذج بالفعل في مرحلة الإنتاج. أي من الإستراتيجيات المؤقتة التالية ستساعد في التخفيف من الأخطاء في تنبؤات النموذج؟