Производственные системы машинного обучения: проверьте свои знания

  1. Вы используете машинное обучение для создания модели классификации, которая предсказывает появление единорогов. В вашем наборе данных содержится информация о 10 000 появлениях единорогов и 10 000 неявках единорогов. Набор данных содержит местоположение, время суток, высоту, температуру, влажность, древесный покров, наличие радуги и некоторые другие характеристики.

    После запуска предсказателя появления единорога вам нужно будет поддерживать свою модель в актуальном состоянии, переобучаясь на новых данных. Поскольку вы собираете слишком много новых данных для обучения, вы решаете ограничить объем обучающих данных, отбирая новые данные в течение определенного периода времени. Вам также необходимо учитывать ежедневные и годовые закономерности появления единорогов. Какое окно времени вы выберете?

  2. Вы запускаете свой предсказатель внешности единорога. Это работает хорошо! Вы уходите в отпуск и возвращаетесь через три недели и обнаруживаете, что качество вашей модели значительно упало. Предположим, что поведение единорога вряд ли существенно изменится через три недели. Каково наиболее вероятное объяснение снижения качества?

  3. Вы просматриваете прогнозы модели для Антарктиды и обнаруживаете, что модель дает неверные прогнозы с тех пор, как модель была запущена в производство. Что из перечисленного может быть источником проблемы?

  4. Ваш предсказатель появления единорога работает уже год. Вы устранили множество проблем, и качество теперь на высоком уровне. Однако вы заметили небольшую, но постоянную проблему. Качество вашей модели в городских районах немного снизилось. В чем может быть причина?

  5. Благодаря всем вашим усилиям по устранению неполадок вы значительно улучшили качество прогнозов модели единорога, и в результате ее использование увеличилось в десять раз. Однако сейчас пользователи жалуются, что модель крайне медленная; Запросы на вывод обычно требуют более 30 секунд для возврата прогнозов. Какое из следующих изменений могло бы помочь решить эту проблему?