Набори даних, узагальнення й надмірне навчання: перевірте свої знання

  1. Що з наведеного нижче є прикладом стаціонарного набору даних?

  2. Ви готуєтеся навчати модель для прогнозування ціни реалізації вживаних автомобілів, використовуючи набір даних, що містить такі ознаки: year, model і mileage. Вивчивши набір даних, ви виявили, що значення пробігу відсутні в 150 з 2500 прикладів. Що з наведеного нижче було б розумно зробити? (Виберіть усі варіанти, які підходять.)

    Choose as many answers as you see fit.

  3. Ви навчаєте модель рекомендації фільмів для потокового сервісу, яка має прогнозувати, чи сподобається користувачу певний фільм. Які з дій, наведених нижче, могли б стати обґрунтованими проксі-мітками для висновку "Користувачу сподобався фільм"? (Виберіть усі варіанти, які підходять.)

    Choose as many answers as you see fit.

  4. Правда чи неправда. Гарний спосіб запобігти надмірному навчанню – тренувати модель до досягнення низького значення втрат на тестових даних.

  5. Заповніть пропуск у реченні нижче.
    Регуляризація покращує здатність моделі узагальнювати нові дані, штрафуючи за ___ під час навчання.