프로덕션 ML 시스템: 지식 테스트

  1. 머신러닝을 사용하여 유니콘의 형상을 예측하는 분류 모델을 빌드하고 있습니다. 데이터 세트에는 유니콘 출현 10,000회와 외형 10,000회가 자세히 설명되어 있습니다. 데이터 세트에는 위치, 시간, 고도, 온도, 습도, 나무 덮개, 무지개의 존재 등 여러 가지 특성이 포함되어 있습니다.

    유니콘 모양 예측기를 실행한 후에는 새 데이터로 다시 학습하여 모델을 최신 상태로 유지해야 합니다. 학습에 사용할 새 데이터를 너무 많이 수집하므로 일정 기간에 걸쳐 새 데이터를 샘플링하여 학습 데이터를 제한하기로 결정했습니다. 유니콘이 등장하는 일일 및 연간 패턴도 고려해야 합니다. 어떤 기간을 선택하시겠어요?

  2. 유니콘 모양 예측기를 실행합니다. 잘 작동하네! 휴가를 떠났다가 3주 후에 돌아온 후 모델 품질이 크게 떨어졌음을 알게 됩니다. 유니콘의 행동이 3주 후에 크게 변할 것 같지 않다고 가정해 보겠습니다. 화질 저하에 대한 가장 적절한 설명은 무엇인가요?

  3. 남극 대륙에 대한 모델의 예측을 검토한 결과 모델이 프로덕션으로 출시된 이후 모델이 제대로 예측하지 못했다는 것을 알게 되었습니다. 다음 중 문제의 원인이 될 수 있는 것은 무엇인가요?

  4. 유니콘 출현 예측기가 1년 동안 작동했습니다. 많은 문제가 해결되었으며 이제 품질이 개선되었습니다. 그러나 작지만 지속적인 문제가 발생합니다. 도시 지역에서 모델 품질이 약간 떨어졌습니다. 원인이 무엇일까요?

  5. 문제 해결을 통해 유니콘 모델의 예측 품질을 크게 향상했으며, 그 결과 사용량이 10배 증가했습니다. 하지만 이제 사용자들은 모델이 매우 느리다는 불만이 제기되고 있습니다. 추론 요청은 일반적으로 예측을 반환하는 데 30초 넘게 걸립니다. 다음 중 이 문제를 해결하는 데 도움이 되는 변경사항은 무엇인가요?