자동화된 머신러닝 (AutoML)

새 머신러닝 (ML) 프로젝트를 시작하는 경우 수동 학습만이 머신러닝 모델을 빌드하는 유일한 방법인지 궁금할 수 있습니다. 수동 학습에서는 ML 프레임워크를 사용하여 코드를 작성하여 모델을 만듭니다. 이 과정에서 탐색할 알고리즘을 선택하고 초매개변수를 반복적으로 조정하여 적절한 모델을 찾습니다.

물론 모델 학습 외에도 고려해야 할 사항이 있습니다. 실제로 프로토타입에서 프로덕션으로 머신러닝 모델을 빌드하려면 반복적인 작업과 전문 기술이 필요합니다. 간단한 탐색형 ML 워크플로는 다음과 같습니다.

그림 1. 간단한 머신러닝 워크플로
그림 1. 간단한 머신러닝 탐색 워크플로

반복 작업: ML 워크플로에는 반복적인 작업과 실험이 포함될 수 있습니다. 예를 들어 모델 개발 중에는 일반적으로 가장 적절한 모델을 식별하기 위해 다양한 알고리즘과 초매개변수 조합을 살펴봐야 합니다. 수동 학습을 사용하면 모델을 학습시키는 특수 코드를 작성한 다음 코드를 조정하여 다양한 ML 알고리즘과 초매개변수를 사용한 실험을 실행하여 최적의 모델을 찾습니다. 소규모 프로젝트 또는 탐색적 프로젝트의 경우 이 수동 프로세스가 문제가 되지 않을 수 있지만 대규모 프로젝트의 경우 이러한 반복 작업에 시간이 많이 걸릴 수 있습니다.

전문 기술 - ML 모델을 수동으로 개발하려면 전문 기술이 필요합니다. 실제로 머신러닝 모델을 개발할 계획인 모든 팀에 이러한 기술이 있는 것은 아닙니다. 팀에 전담 데이터 과학자가 없는 경우 이 작업을 수동으로 수행하는 것이 불가능할 수도 있습니다.

다행히 모델 개발의 특정 단계를 자동화하여 반복적인 작업의 부담과 전문 기술의 필요성을 줄일 수 있습니다. 이러한 작업을 자동화하는 것이 자동화된 머신러닝 (AutoML)에 관한 이 모듈의 주제입니다.

AutoML이란 무엇인가요?

AutoML은 머신러닝 워크플로에서 특정 작업을 자동화하는 프로세스입니다. AutoML은 더 많은 사용자가 더 빠르고 쉽게 머신러닝 모델을 빌드할 수 있도록 지원하는 도구 및 기술의 집합이라고 생각할 수 있습니다. 자동화는 ML 워크플로 전반에서 도움이 될 수 있지만 AutoML과 관련된 태스크는 그림 1에 표시된 모델 개발 주기에 포함된 태스크입니다. 반복되는 작업에는 다음이 포함됩니다.

  • 데이터 엔지니어링
    • 특성 추출
    • 특성 선택
  • 교육
    • 적절한 ML 알고리즘을 식별합니다.
    • 최적의 하이퍼파라미터 선택
  • 분석
    • 테스트 및 검증 데이터 세트를 기반으로 학습 중에 생성된 측정항목 평가

AutoML을 사용하면 특성 선택, 초매개변수 조정, 적절한 알고리즘 선택이 아닌 ML 문제와 데이터에 집중할 수 있습니다.