Якщо ви розпочинаєте новий проект машинного навчання, вас може цікавити, чи навчання вручну – єдиний варіант для створення моделі. Щоб навчати вручну, потрібно написати код, використовуючи фреймворк машинного навчання для створення моделі. Під час цього процесу ви виберете, які алгоритми досліджувати, і ітеративно налаштуєте гіперпараметри, щоб отримати відповідну модель.
Звичайно, навчання моделі – це не єдине, про що потрібно думати. На практиці створення моделі машинного навчання – від прототипу до версії, яка працює в реальних умовах, – передбачає повторювані завдання й вимагає спеціальних навичок. Простий дослідницький робочий процес машинного навчання виглядає приблизно так:
Повторювані завдання. Робочий процес машинного навчання може включати повторювану роботу й експерименти. Наприклад, під час розробки моделі зазвичай потрібно досліджувати різні комбінації алгоритмів і гіперпараметрів, щоб визначити найбільш прийнятну. Щоб навчати модель вручну, потрібно написати для цього спеціальний код, а потім коригувати його, щоб проводити експерименти з різними алгоритмами й гіперпараметрами машинного навчання з метою знайти оптимальну модель. Для невеликих або дослідницьких проектів цей ручний процес може не створювати проблем, але якщо проект великий, такі повторювані завдання забирають багато часу.
Спеціальні навички. Щоб розробляти модель машинного навчання вручну, потрібні спеціальні навички. На практиці не кожна команда, яка планує розробити модель машинного навчання, може їх мати. Якщо в команді немає спеціального фахівця з обробки даних, може навіть виявитися, що виконати цю роботу вручну неможливо.
На щастя, певні етапи розробки моделі можна автоматизувати, щоб зменшити тягар повторюваної роботи й потребу в спеціальних навичках. Автоматизація таких завдань є предметом цього модуля з автоматизованого машинного навчання (AutoML).
Що таке AutoML?
AutoML – це процес автоматизації певних завдань у робочому процесі машинного навчання. AutoML можна уявити як набір інструментів і технологій, які роблять процес створення моделей машинного навчання швидшим і доступнішим для ширшої групи користувачів. Хоча автоматизацію можна використовувати на різних етапах робочого процесу, пов’язаного з машинним навчанням, з AutoML часто асоціюють завдання, які включено в цикл розробки моделі, показаний на рисунку 1. Повторювані завдання, які до них належать, наведено нижче.
- Інженерія даних
- Конструювання ознак
- Відбір ознак
- Навчання
- Визначення відповідного алгоритму машинного навчання
- Вибір оптимальних гіперпараметрів
- Аналіз
- Оцінка показників, згенерованих під час навчання на основі наборів даних для тестування й перевірки.
Використовуючи AutoML, ви можете зосередитися на вибраній проблемі машинного навчання й даних, а не на відборі ознак, налаштуванні гіперпараметрів і пошуку правильного алгоритму.