일반적으로 다음 두 가지 방법 중 하나로 모델을 학습시킬 수 있습니다.
- 정적 학습 (또한 오프라인 학습이라고 함)을 사용하면 모델을 학습시키고 한 번만 사용할 수 있습니다. 그런 다음 학습된 모델을 일정 시간 동안 서빙합니다.
- 동적 학습 (또한 온라인 학습이라고 함)은 모델을 학습시키고 최소 빈도로 설정할 수 있습니다 일반적으로 가장 많은 모델을 학습시키는 작업도 반복해야 합니다
표 1. 주요 장단점
정적 학습 | 동적 학습 | |
---|---|---|
장점 | 더 간단함. 모델을 한 번만 개발하고 테스트하면 됩니다. | 더욱 뛰어난 적응력. 모델은 특성과 라벨의 관계가 변경됩니다. |
단점 | 때로는 더 늦어질 수 있죠 특성과 특성의 관계가 라벨이 변경되면 모델의 예측이 저하됩니다. | 더 많은 작업. 새 제품을 빌드, 테스트, 출시해야 합니다. 있습니다. |
데이터 세트가 실제로 시간이 지나도 변하지 않는다면 정적 학습을 선택합니다. 왜냐하면 동적 학습보다 생성 및 유지 비용이 저렴합니다. 그러나 데이터 세트는 가성비는 시간이 지남에 따라 변화하는 경향이 있습니다 변하지 않습니다. 핵심은 정적인 경우에도 여전히 입력 데이터의 변화를 모니터링해야 합니다.
예를 들어 사용자가 특정 유형의 데이터를 수집할 가능성을 예측하도록 학습된 모델을 꽃을 구입할 것입니다. 시간 압박으로 인해 모델이 한 번만 학습됨 를 발표했습니다. 이 모델은 몇 달 동안은 잘 작동하지만 예측을 할 수 없게 됨 밸런타인데이 무렵에 꽃이 활짝 핀 연휴 동안의 사용자 행동이 크게 변합니다.
정적 및 동적 학습에 관해 자세히 알아보려면 ML 프로젝트 관리 오신 것을 환영합니다
연습문제: 이해도 확인
다음 중 올바른 설명 두 가지는 무엇인가요?
정적 (오프라인) 학습?
새 데이터가 도착할 때마다 모델이 최신 상태로 유지됩니다.
실제로 오프라인으로 학습하면 모델은
새 데이터가 도착하는 즉시 통합합니다. 이를 통해
노후화가 필요한 경우
달라진다는 사실을 기억하실 겁니다
모델을 프로덕션에 적용하기 전에 검증할 수 있습니다.
예, 오프라인 학습은 모델을 검증할 충분한 기회를 제공합니다.
성능을 개선하는 데 도움이 됩니다
오프라인 학습에서는 학습 작업을 모니터링할 필요가 더 적음
더 많을 것입니다.
일반적으로 학습 시 모니터링 요구사항은 더 적음
오프라인 학습을 사용하면 여러 프로덕션 작업을 할 필요가 없습니다.
고려해야 합니다 하지만 모델을 자주 학습시킬수록
모니터링에 더 많이 투자해야 합니다 사용자는
코드가 올바르게 변경되었는지 정기적으로 확인하고
모델 품질에 부정적인 영향을 미치지 않습니다.
입력 데이터의 모니터링은 거의 필요하지 않으며,
살펴보겠습니다
직관적이지 않게, 서빙 단계에서 입력 데이터를 모니터링해야 함
있습니다. 입력 분포가 변경되면 모델의
예측의 신뢰성이 떨어질 수 있습니다. 예를 들어 모델이
갑자기 여름철 의류 데이터만으로 학습하여
겨울 의류 구매 행동을 예측할 수 있습니다.
다음 중 참인 문장 하나는 무엇인가요?
어떻게 해야 할까요?
새 데이터가 도착할 때마다 모델이 최신 상태로 유지됩니다.
이것이 온라인 교육의 주요 이점입니다. 피처스토어가
모델이 새로운 데이터를 학습함에 따라
들어옵니다.
학습 작업을 모니터링할 필요가 거의 없습니다.
사실 학습 작업을 지속적으로 모니터링해야
정상 작동해야 합니다. 또한
모델을 롤백하는 기능과 같은
이전 스냅샷으로 돌아가서 학습에서 문제가 발생할 경우를 대비해
손상과 같은 문제를 일으킬 수 있습니다
입력 데이터의 모니터링은 거의 필요하지 않으며,
살펴보겠습니다
정적 오프라인 모델과 마찬가지로
동적으로 업데이트되는 모델에 대한 입력을 모니터링합니다. 현재 위치:
갑작스러운 계절성 영향의 위험이
없지만
입력에 대한 대규모 변경 (예: 업스트림 데이터 소스)
여전히 신뢰할 수 없는 예측이 발생할 수 있습니다.