Проверьте свое понимание

Следующие вопросы помогут вам укрепить понимание основных концепций машинного обучения.

Предсказательная сила

Модели контролируемого машинного обучения обучаются с использованием наборов данных с помеченными примерами. Модель учится предсказывать метку на основе функций. Однако не каждая функция в наборе данных обладает предсказательной силой. В некоторых случаях лишь несколько признаков действуют как предикторы метки. В приведенном ниже наборе данных используйте цену в качестве метки, а остальные столбцы — в качестве функций.

Маркированный пример атрибутов автомобиля.

Какие три характеристики, по вашему мнению, лучше всего влияют на цену автомобиля?
Размер_шины, колесная_база, год.
Цвет, высота, марка_модель.
Марка_модель, год, миль.
Майлз, коробка передач, марка_модель.

Контролируемое и неконтролируемое обучение

В зависимости от проблемы вы будете использовать контролируемый или неконтролируемый подход. Например, если вы заранее знаете значение или категорию, которую хотите предсказать, вы должны использовать обучение с учителем. Однако, если вы хотите узнать, содержит ли ваш набор данных какие-либо сегментации или группы связанных примеров, вы должны использовать обучение без учителя.

Предположим, у вас есть набор данных о пользователях веб-сайта интернет-магазина, и он содержит следующие столбцы:

Изображение ряда атрибутов клиента.

Если бы вы хотели понять типы пользователей, посещающих сайт, вы бы использовали контролируемое или неконтролируемое обучение?
Обучение без присмотра.
Контролируемое обучение, потому что я пытаюсь предсказать, к какому классу принадлежит пользователь.

Предположим, у вас есть набор данных об энергопотреблении домов со следующими столбцами:

Изображение ряда домашних атрибутов.

Какой тип ML вы бы использовали для прогнозирования количества киловатт-часов, используемых в год для недавно построенного дома?
Обучение без присмотра.
Обучение под контролем.

Предположим, у вас есть набор полетных данных со следующими столбцами:

Изображение ряда полетных данных.

Если бы вы хотели спрогнозировать стоимость билета на автобус, вы бы использовали регрессию или классификацию?
Регрессия
Классификация
Сможете ли вы на основе набора данных обучить модель классификации, чтобы классифицировать стоимость билета на автобус как «высокую», «среднюю» или «низкую»?
Нет. Модели классификации прогнозируют только две категории, например spam или not_spam . Эта модель должна будет предсказать три категории.
Да, но сначала нам нужно преобразовать числовые значения в столбце coach_ticket_cost в категориальные значения.
Нет. Создать классификационную модель невозможно. Значения coach_ticket_cost являются числовыми, а не категориальными.

Обучение и оценка

После обучения модели мы оцениваем ее, используя набор данных с помеченными примерами, и сравниваем прогнозируемое значение модели с фактическим значением метки.

Выберите два лучших ответа на вопрос.

Если предсказания модели далеки от реальности, что вы можете сделать, чтобы сделать их лучше?
Переобучите модель, используя более крупный и разнообразный набор данных.
Попробуйте другой подход к обучению. Например, если вы использовали контролируемый подход, попробуйте неконтролируемый подход.
Вы не можете исправить модель, прогнозы которой далеки от реальности.
Переобучите модель, но используйте только те функции, которые, по вашему мнению, обладают наибольшей прогностической способностью для метки.

Теперь вы готовы сделать следующий шаг на пути к машинному обучению:

  • Руководство «Люди + ИИ» . Если вы ищете набор методов, лучших практик и примеров, представленных сотрудниками Google, отраслевыми экспертами и научными исследованиями по использованию машинного обучения.

  • Формулировка проблемы . Если вы ищете проверенный на практике подход к созданию моделей машинного обучения и избежание распространенных ошибок на этом пути.

  • Ускоренный курс машинного обучения . Если вы готовы к углубленному и практическому подходу к изучению большего о ML.