Упражнение 7а: Ваша проблема, сформулированная как задача машинного обучения

Запишите или установите флажок для того, что вы считаете лучшим техническим решением вашей проблемы. Нашу проблему лучше всего сформулировать так:
который предсказывает или генерирует:

Если ваше решение лучше всего подходит для прогнозного машинного обучения, см. следующие вопросы. Если ваше решение оформлено как генеративный ИИ, см. MakerSuite — IDE на основе браузера, которая позволяет вам экспериментировать с различными подсказками для быстрого прототипирования с генеративными языковыми моделями.

Упражнение 7б. Превратите свою проблему в более простую.

При первом запуске более простые формулировки проблем легче обдумать и реализовать. Возьмите данную проблему и сформулируйте ее как бинарную классификацию или задачу одномерной регрессии (или и то, и другое).

Упражнение 8. Разработайте данные для модели

Запишите данные, которые вы хотите, чтобы прогнозирующая модель машинного обучения использовала для прогнозирования.
Пустая таблица с 3 строками и 4 столбцами, помеченными: input1, input 2, input3 и output (метка)
Советы для успеха
  • Одна строка представляет собой один фрагмент данных, для которого делается одно предсказание.
  • Включайте только ту информацию, которая доступна на момент составления прогноза.
  • Каждый вход может быть скалярным или одномерным списком целых чисел, чисел с плавающей запятой или байтов (включая строки).
  • Если входные данные имеют структуру, отличную от скалярного или одномерного списка, вы можете подумать, является ли это лучшим представлением ваших данных. Например:
    • Если ячейка представляет две или более семантически разных вещей в одномерном списке, вы можете разделить их на отдельные входные данные.
    • Если ячейка представляет вложенный буфер протокола, вы можете сгладить каждое поле вложенного буфера протокола.
    • Исключения: аудиоданные, изображения и видеоданные, где ячейка представляет собой блок байтов.

Упражнение 9. Откуда берутся данные

Запишите, откуда поступает каждый вход. Оцените, сколько работы потребуется, чтобы разработать конвейер данных для построения каждого столбца для строки.
Пустая таблица с 2 строками и 4 столбцами, помеченными: input1, input 2, input3 и output.
Советы для успеха
Когда выходные данные примера станут доступны для обучения?
  • Если получить пример вывода сложно, вы можете вернуться к Упражнению 5 (Использование вывода) и проверить, можете ли вы использовать другой вывод для своей модели.
Убедитесь, что все ваши входные данные (кроме выходных) доступны во время обслуживания (когда делается прогноз) именно в том формате, который вы записываете.
  • Если трудно получить все ваши входные данные во время обслуживания в точно таком же формате, вы можете вернуться к Упражнению 8 (Разработайте свои данные для модели), чтобы пересмотреть входные данные, или к Упражнению 5, чтобы пересмотреть, когда можно делать обслуживание.

Упражнение 10. Легкодоступные исходные данные

Среди входных данных, перечисленных в упражнении 8, выберите 1–3 исходных данных, которые легко получить и которые, по вашему мнению, приведут к разумному исходному результату.
Пустая таблица с 2 строками и 4 столбцами, помеченными: вход 1, вход 2, вход 3 и выход.
Советы для успеха
  • В упражнении 6 вы перечислили набор эвристик, которые вы могли бы использовать. Какие входные данные были бы полезны для реализации этих эвристик?
  • Учитывайте инженерные затраты на разработку конвейера данных для подготовки входных данных и ожидаемую выгоду от наличия каждого входного параметра в модели.
  • Сосредоточьтесь на входных данных, которые можно получить из одной системы с помощью простого конвейера. При первом запуске рекомендуется начинать с минимально возможной инфраструктуры.

Распечатать или сохранить

Нажмите кнопку ниже, чтобы распечатать или сохранить ответы в формате .pdf.

Распечатать страницу