AutoML: преимущества и ограничения

В этом разделе обсуждаются некоторые преимущества и ограничения AutoML , и он может помочь вам решить, подходит ли AutoML для вашего проекта.

Преимущества

Некоторые из наиболее распространенных причин, по которым вы можете использовать AutoML, включают:

  • Чтобы сэкономить время : многие люди выбирают AutoML, чтобы сэкономить время, избегая обширных ручных экспериментов в поисках лучшей модели.
  • Чтобы улучшить качество модели ML : инструменты AutoML могут выполнять всесторонний поиск модели самого высокого качества.
  • Чтобы построить модель машинного обучения без необходимости специальных навыков : побочным эффектом автоматизации задач машинного обучения является демократизация машинного обучения. Пользователям не нужно глубоко разбираться в алгоритмах машинного обучения или программировании для разработки модели машинного обучения.
  • Дымовое тестирование набора данных . Даже если вы опытный разработчик моделей, AutoML может быстро дать вам базовую оценку того, имеет ли набор данных достаточный сигнал во всем его шуме. Если инструмент AutoML не может построить даже посредственную модель, возможно, не стоит тратить время на создание хорошей модели вручную.
  • Чтобы оценить набор данных : многие системы AutoML помогают вам оценить не только модели, которые они создают, но также помогают оценить функции, которые используются при обучении этих моделей. Даже если вы не используете полученную модель, инструменты AutoML могут помочь вам определить, какие из ваших функций, возможно, не стоит собирать и включать в окончательный набор данных.
  • Для внедрения лучших практик . Автоматизация включает встроенную поддержку для применения лучших практик машинного обучения к каждому поиску модели.

Ограничения

Однако перед выбором AutoML следует учитывать некоторые ограничения:

  • Качество модели может быть не таким хорошим, как при ручном обучении. Использование обобщенного алгоритма оптимизации для поиска наилучшего сочетания архитектуры, гиперпараметров и проектирования функций для любого случайного набора данных часто означает, что мотивированный эксперт, располагающий достаточным количеством времени, может создать модель с лучшим качеством прогнозирования.
  • Поиск модели и ее сложность могут быть непрозрачными. При использовании AutoML трудно понять, как инструмент пришел к лучшей модели. Фактически, сами выходные модели могут быть созданы на основе различных архитектур, гиперпараметров и стратегий разработки функций. Модели, созданные с помощью AutoML, сложно воспроизвести вручную.
  • Несколько прогонов AutoML могут показывать большую дисперсию : из-за того, что алгоритм оптимизации итеративно находит то, что, по его мнению, является лучшими значениями для построения модели, разные прогоны AutoML могут выполнять поиск в разных частях пространства и в конечном итоге оказаться в умеренно (или даже значительно) разных места. Повторная настройка с помощью AutoML для создания новой архитектуры модели может привести к большей вариативности, чем простое переобучение предыдущей архитектуры выходной модели.
  • Модели нельзя настраивать во время обучения. Если ваш вариант использования требует настройки или настройки в процессе обучения, AutoML может оказаться для вас неподходящим выбором.

Требования к данным

Независимо от того, используете ли вы индивидуальное обучение или систему AutoML, при построении модели с нуля вы можете рассчитывать только на то, что вам потребуются большие объемы данных. Преимущество AutoML заключается в том, что вы можете игнорировать поиск архитектуры и гиперпараметров и сосредоточиться в первую очередь на качестве ваших данных.

Существуют также специализированные системы AutoML, которые могут обучать модели со значительно меньшим количеством данных, поскольку используют трансферное обучение . Например, вместо того, чтобы требовать сотни тысяч примеров для построения модели классификации изображений, эти специализированные системы AutoML могут использовать только несколько сотен помеченных изображений вместе с переносом обучения из существующей модели структуры классификации изображений.

Подходит ли AutoML для вашего проекта?

AutoML может помочь любому — от новичков до экспертов — использовать машинное обучение для создания продуктов и решения проблем. Если вы пытаетесь решить, подходит ли AutoML для вашего проекта, рассмотрите следующие компромиссы:

  • AutoML — отличный выбор для команды с ограниченным опытом создания моделей машинного обучения или опытных команд, которые стремятся к повышению производительности и не имеют требований к настройке.
  • Пользовательское (ручное) обучение более целесообразно, когда качество модели важно и команде необходимо иметь возможность настраивать свою модель. В этих случаях ручное обучение может потребовать больше времени для экспериментов и создания решения, но команда часто может достичь модели более высокого качества, чем с помощью решения AutoML.