Справедливость: проверьте свои знания

  1. Правда или ложь: историческое смещение возникает, когда модель обучается на старых данных.

  2. Инженеры обучают регрессионную модель прогнозированию калорийности блюд на основе различных данных, которые они собрали с веб-сайтов рецептов по всему миру, включая размер порции, ингредиенты и методы приготовления. Какие из следующих проблем с данными являются потенциальными источниками систематической ошибки, которые следует изучить дополнительно?

    Выбирайте столько ответов, сколько считаете нужным.

  3. Модель обнаружения сарказма была обучена на 80 000 текстовых сообщениях: 40 000 сообщений, отправленных взрослыми (18 лет и старше), и 40 000 сообщений, отправленных несовершеннолетними (младше 18 лет). Затем модель была оценена на тестовом наборе из 20 000 сообщений: 10 000 от взрослых и 10 000 от несовершеннолетних. Следующие матрицы путаницы показывают результаты для каждой группы (положительный прогноз означает классификацию «саркастических»; отрицательный прогноз означает классификацию «не саркастичных»):

    Взрослые

    Истинные положительные результаты (TP): 512 Ложные срабатывания (FP): 51
    Ложноотрицательных результатов (ЛН): 36 Истинно отрицательные результаты (TN): 9401
    Точность = TP/(TP + FP) = 0,909
    Напомним = TP/(TP + FN) = 0,934

    Несовершеннолетние

    Истинные положительные результаты (TP): 2147 Ложные срабатывания (FP): 96
    Ложноотрицательных результатов (FN): 2177. Истинно отрицательные результаты (TN): 5580
    Точность = TP/(TP + FP) = 0,957
    Напомним = TP/(TP + FN) = 0,497

    Какие из следующих утверждений о производительности модели на тестовом наборе верны?

    Выбирайте столько ответов, сколько считаете нужным.

  4. Какая из следующих гипотез могла бы объяснить расхождения в результатах подгрупп на тестовом наборе для модели обнаружения сарказма, описанной выше?

    Выбирайте столько ответов, сколько считаете нужным.

  5. Инженеры работают над переобучением приведенной выше модели сарказма, чтобы устранить несоответствия в точности обнаружения сарказма в разных возрастных группах, но модель уже запущена в производство. Какая из следующих временных стратегий поможет уменьшить ошибки в прогнозах модели?