Набори даних, узагальнення й надмірне навчання: перевірте свої знання

  1. Що з наведеного нижче є прикладом стаціонарного набору даних?

  2. Ви готуєтеся навчати модель для прогнозування ціни реалізації вживаних автомобілів, використовуючи набір даних, що містить такі ознаки: year, model і mileage. Вивчивши набір даних, ви виявили, що значення пробігу відсутні в 150 з 2500 прикладів. Що з наведеного нижче було б розумно зробити? (Виберіть усі варіанти, які підходять.)

    Виберіть потрібну кількість відповідей.

  3. Ви навчаєте модель рекомендації фільмів для потокового сервісу, яка має прогнозувати, чи сподобається користувачу певний фільм. Які з дій, наведених нижче, могли б стати обґрунтованими проксі-мітками для висновку "Користувачу сподобався фільм"? (Виберіть усі варіанти, які підходять.)

    Виберіть потрібну кількість відповідей.

  4. Правда чи неправда. Гарний спосіб запобігти надмірному навчанню – тренувати модель до досягнення низького значення втрат на тестових даних.

  5. Заповніть пропуск у реченні нижче.
    Регуляризація покращує здатність моделі узагальнювати нові дані, штрафуючи за ___ під час навчання.