프로덕션 ML 시스템: 정적 학습과 동적 학습 비교

대략적으로 모델을 학습하는 방법에는 두 가지가 있습니다.

  • 정적 학습 (오프라인 학습이라고도 함)은 모델을 한 번만 학습한다는 의미입니다. 그런 다음 학습된 동일한 모델을 일정 기간 제공합니다.
  • 동적 학습 (온라인 학습이라고도 함)은 모델을 지속적으로 또는 적어도 자주 학습하는 것을 의미합니다. 일반적으로 가장 최근에 학습된 모델을 제공합니다.
그림 2. 원시 반죽으로 동일한 빵 3개를 만듭니다.
그림 2. 정적 학습 한 번 학습하고 동일한 빌드된 모델을 여러 번 제공합니다. (이미지: Pexels 및 fancycrave1)

 

그림 3. 생 반죽은 매번 약간 다른 빵을 만듭니다.
그림 3. 동적 학습 자주 재학습하고 가장 최근에 빌드된 모델을 제공합니다. (이미지: Pexels 및 Couleur)

 

표 1. 주요 장단점

정적 학습 동적 학습
장점 더 간단합니다. 모델은 한 번만 개발하고 테스트하면 됩니다. 더욱 적응력이 뛰어납니다. 모델은 특성과 라벨 간의 관계가 변경될 때마다 이를 반영합니다.
단점 때로는 더 오래된 데이터도 있습니다. 특성과 라벨 간의 관계가 시간이 지남에 따라 변경되면 모델의 예측이 저하됩니다. 더 많은 작업 항상 새 제품을 빌드, 테스트, 출시해야 합니다.

데이터 세트가 시간이 지남에 따라 실제로 변경되지 않는 경우 동적 학습보다 만들고 유지하는 데 드는 비용이 적으므로 정적 학습을 선택하세요. 하지만 해수면처럼 일정하다고 생각되는 지형지물도 포함된 데이터 세트는 시간이 지남에 따라 변경되는 경향이 있습니다. 요약: 정적 학습이라도 입력 데이터의 변경사항을 모니터링해야 합니다.

예를 들어 사용자가 꽃을 구매할 가능성을 예측하도록 학습된 모델을 생각해 보겠습니다. 시간 제약으로 인해 7월과 8월의 꽃 구매 행동 데이터 세트를 사용하여 모델을 한 번만 학습합니다. 이 모델은 몇 개월 동안은 잘 작동하지만 발렌타인 데이 전후에는 꽃 관련 연말연시 기간 동안 사용자 행동이 극적으로 변하기 때문에 예측이 매우 부정확해집니다.

정적 학습과 동적 학습에 대해 자세히 알아보려면 ML 프로젝트 관리 과정을 참고하세요.

연습문제: 이해도 확인

다음 중 정적 (오프라인) 학습에 관해 참인 문장은 두 가지입니다.
모델을 프로덕션에 적용하기 전에 확인할 수 있습니다.
추론 시 입력 데이터를 거의 모니터링할 필요가 없습니다.
오프라인 학습은 온라인 학습보다 학습 작업을 덜 모니터링해야 합니다.
새 데이터가 입력됨에 따라 모델이 최신 상태로 유지됩니다.
다음 중 동적 (온라인) 학습에 관해 참인 문장은 무엇인가요?
학습 작업을 거의 모니터링할 필요가 없습니다.
새 데이터가 입력됨에 따라 모델이 최신 상태로 유지됩니다.
추론 시 입력 데이터를 거의 모니터링할 필요가 없습니다.