ML 프로젝트는 구체적인 목표, 작업, 결과가 있는 단계별로 진행됩니다. ML 개발 단계를 명확하게 이해하면 엔지니어링 책임을 설정하고, 이해관계자 기대치를 관리하고, 리소스를 효율적으로 할당하는 데 도움이 됩니다.
단계를 성공적으로 진행하는 것은 장기적으로 비즈니스 문제를 해결하는 ML 모델을 설계, 조립, 빌드하는 데 기본이 됩니다.
개략적으로 ML 솔루션 구현은 다음 단계로 구성됩니다.
- 아이디어 구상 및 계획
- 실험
- 파이프라인 빌드
- 생산화
아이디어 구상 및 계획
아이디어 구상 및 계획 단계에서는 ML 솔루션의 관점에서 문제를 구성하고 프로젝트의 타당성을 추정합니다.
- 목표: ML이 문제에 가장 적합한 솔루션인지 확인합니다.
- 작업: 비즈니스 문제를 분석하여 프로젝트의 제약 조건을 파악합니다.
- 결과: ML 솔루션으로 문제를 해결하는 방법을 설명하는 설계 문서입니다.
실험
실험은 머신러닝의 핵심입니다. 이 단계에서는 ML 솔루션이 실행 가능한지 확인합니다. 해결책을 찾는 것은 반복적인 프로세스입니다. 문제를 해결하는 올바른 특성, 초매개변수, 모델 아키텍처 조합을 찾기 전에 수백 번의 실험을 시도하는 것은 드문 일이 아닙니다.
- 목표: 비즈니스 문제를 해결하는 모델을 빌드합니다.
- 작업: 특징, 초매개변수, 모델 아키텍처를 실험합니다.
- 결과: 프로덕션에 적용할 수 있을 만큼 품질이 좋은 모델
파이프라인 빌드 및 프로덕션화
파이프라인 빌드 및 프로덕션화 단계에서는 데이터를 처리하고, 모델을 학습시키고, 예측을 제공하는 파이프라인을 빌드합니다. 그런 다음 필요한 모니터링 및 로깅 인프라를 사용하여 모델과 파이프라인을 프로덕션에 배포합니다.
- 목표: 프로덕션에서 모델을 확장, 모니터링, 유지관리하기 위한 인프라를 구축하고 구현합니다.
- 작업: 프로덕션에서 최신 모델을 유지하기 위한 여러 작업을 자동화하는 파이프라인을 빌드합니다.
- 결과: 검증된 ML 파이프라인
엔드 투 엔드 ML 워크플로
다음 다이어그램은 전체 엔드 투 엔드 ML 워크플로를 보여주며 각 단계와 태스크, 결과를 나열합니다.
그림 1. ML 워크플로의 네 가지 주요 단계
주의사항
각 단계에는 여러 가지 문제가 있습니다. 이를 인식하고 계획하지 않으면 기한을 놓치고, 엔지니어가 좌절하고, 프로젝트가 실패할 수 있습니다.