Наборы данных, обобщение и переобучение: проверьте свои знания

  1. Что из перечисленного является примером стационарного набора данных?

  2. Вы готовитесь к обучению модели для прогнозирования продажной цены подержанных автомобилей, используя набор данных, содержащий следующие функции: year , model и mileage . Изучив набор данных, вы обнаружите, что значения пробега отсутствуют в 150 из 2500 примеров. Какой из следующих вариантов было бы разумно предпринять? (Выберите все, что подходит)

    Выбирайте столько ответов, сколько считаете нужным.

  3. Вы обучаете модель рекомендаций фильмов службы потокового вещания, чтобы предсказать, понравится ли пользователю тот или иной фильм. Что из следующего будет разумным прокси-ярлыком для фразы «Пользователю понравился фильм»? (Выберите все, что подходит)

    Выбирайте столько ответов, сколько считаете нужным.

  4. Верно или неверно: обучение вашей модели до тех пор, пока она не достигнет низкого значения потерь на ваших тестовых данных, — это хороший способ предотвратить переобучение.

  5. Заполните пропуск в следующем предложении:
    Регуляризация улучшает способность вашей модели обобщать новые данные, наказывая ___ во время обучения.