Об’єктивність: перевірте свої знання

  1. Правда чи неправда: історична упередженість виникає, коли модель навчається на старих даних.

  2. Розробники навчають регресійну модель, щоб вона прогнозувала калорійність страв на основі різноманітних даних ознак, зібраних із сайтів із рецептами з усього світу. Це, наприклад, розмір порції, інгредієнти й способи приготування. Які з проблем із даними, наведених нижче, є потенційними джерелами упередженості, які слід дослідити ретельніше?

    Виберіть потрібну кількість відповідей.

  3. Модель виявлення сарказму навчалася на 80 000 текстових повідомлень: з них 40 000 надіслали дорослі (віком від 18 років), а інші 40 000 – неповнолітні (які не досягли 18 років). Потім модель оцінювалася на тестовому наборі з 20 000 повідомлень – 10 000 від дорослих і 10 000 від неповнолітніх. Матриці плутанини, наведені нижче, показують результати для кожної групи (позитивний прогноз означає класифікацію в групу "сарказм"; негативний прогноз – у групу "не сарказм").

    Дорослі

    Істиннопозитивні (TP): 512 Хибнопозитивні (FP): 51
    Хибнонегативні (FN): 36 Істиннонегативні (TN): 9401
    Влучність = TP/(TP + FP) = 0,909
    Повнота = TP/(TP + FN) = 0,934

    Неповнолітні

    Істиннопозитивні (TP): 2147 Хибнопозитивні (FP): 96
    Хибнонегативні (FN): 2177 Істиннонегативні (TN): 5580
    Влучність = TP/(TP + FP) = 0,957
    Повнота = TP/(TP + FN) = 0,497

    Які з наведених нижче тверджень щодо ефективності тестового набору моделі правильні?

    Виберіть потрібну кількість відповідей.

  4. Яка з гіпотез, указаних нижче, могла б пояснити розбіжності в результатах для підгруп, які виявила перевірка моделі виявлення сарказму, наведеної вище, на тестовому наборі?

    Виберіть потрібну кількість відповідей.

  5. Інженери працюють над повторним навчанням моделі сарказму, описаної вище, щоб усунути невідповідності в точності виявлення сарказму в повідомленнях від різних вікових категорій населення, проте модель уже використовується в робочому середовищі. Яка з наведених нижче стратегій тимчасових рішень допоможе зменшити помилки в прогнозах моделі?