انصاف: دانش خود را بیازمایید

  1. درست یا نادرست: سوگیری تاریخی زمانی رخ می دهد که یک مدل بر روی داده های قدیمی آموزش داده شود.

  2. مهندسان در حال آموزش یک مدل رگرسیونی برای پیش‌بینی محتوای کالری وعده‌های غذایی بر اساس انواع داده‌های ویژگی هستند که از وب‌سایت‌های دستور غذا در سراسر جهان از جمله اندازه سرو، مواد تشکیل دهنده و تکنیک‌های آماده‌سازی استخراج کرده‌اند. کدام یک از مسائل داده های زیر منابع بالقوه سوگیری هستند که باید بیشتر مورد بررسی قرار گیرند؟

    هر تعداد پاسخ را که مناسب می‌دانید انتخاب کنید.

  3. یک مدل تشخیص طعنه بر روی 80000 پیام متنی آموزش داده شد: 40000 پیام ارسال شده توسط بزرگسالان (18 سال و بالاتر) و 40000 پیام ارسال شده توسط خردسالان (کمتر از 18 سال). سپس این مدل در یک مجموعه آزمایشی از 20000 پیام مورد ارزیابی قرار گرفت: 10000 پیام از بزرگسالان و 10000 پیام از خردسالان. ماتریس‌های سردرگمی زیر نتایج را برای هر گروه نشان می‌دهند (یک پیش‌بینی مثبت به معنی طبقه‌بندی «طعنه‌آمیز» است؛ یک پیش‌بینی منفی نشان‌دهنده طبقه‌بندی «غیر طعنه‌آمیز» است):

    بزرگسالان

    مثبت واقعی (TPs): 512 مثبت کاذب (FPs): 51
    منفی های کاذب (FNs): 36 منفی واقعی (TNs): 9401
    دقت = TP/(TP + FP) = 0.909
    فراخوان = TP/(TP + FN) = 0.934

    خردسالان

    مثبت واقعی (TPs): 2147 مثبت کاذب (FPs): 96
    منفی های کاذب (FNs): 2177 منفی واقعی (TN): 5580
    دقت = TP/(TP + FP) = 0.957
    فراخوان = TP/(TP + FN) = 0.497

    کدام یک از عبارات زیر در مورد عملکرد مجموعه آزمایشی مدل صحیح است؟

    هر تعداد پاسخ را که مناسب می‌دانید انتخاب کنید.

  4. کدام یک از فرضیه‌های زیر می‌تواند تفاوت‌های عملکرد زیرگروه را در مجموعه آزمون مدل تشخیص طعنه در بالا توضیح دهد؟

    هر تعداد پاسخ را که مناسب می‌دانید انتخاب کنید.

  5. مهندسان در حال کار بر روی بازآموزی مدل طعنه در بالا برای رفع تناقضات در دقت تشخیص طعنه در جمعیت‌شناسی سنی هستند، اما این مدل قبلاً به تولید رسیده است. کدام یک از راهبردهای توقف زیر به کاهش خطا در پیش‌بینی‌های مدل کمک می‌کند؟