프로덕션 ML 시스템: 질문

이 강의에서는 프로덕션 시스템의 데이터와 모델에 관해 물어봐야 할 질문에 중점을 둡니다.

각 기능이 유용하게 사용되고 있나요?

모델의 예측 능력에 거의 기여하지 않거나 기여하지 않는 기능을 삭제하기 위해 모델을 지속적으로 모니터링해야 합니다. 이 기능의 입력 데이터가 갑자기 변경되면 모델의 동작도 바람직하지 않은 방식으로 갑자기 변경될 수 있습니다.

다음과 같은 관련 질문도 참고하세요.

  • 기능의 유용성이 포함하는 데 드는 비용을 정당화하나요?

모델에 더 많은 기능을 추가하고 싶은 유혹이 항상 있습니다. 예를 들어 추가하면 모델의 예측이 약간 개선되는 새로운 기능을 찾았다고 가정해 보겠습니다. 약간 더 나은 예측은 약간 더 나쁜 예측보다 확실히 나아 보이지만, 추가 기능으로 인해 유지보수 부담이 가중됩니다.

데이터 소스가 신뢰할 수 있나요?

입력 데이터의 신뢰성에 관해 물어야 할 몇 가지 질문은 다음과 같습니다.

  • 신호를 항상 사용할 수 있나요? 또는 신호가 안정적이지 않은 출처에서 제공되나요? 예를 들면 다음과 같습니다.
    • 과부하 상태에서 비정상 종료되는 서버에서 신호가 발생하나요?
    • 매년 8월에 휴가를 떠나는 사용자의 신호인가요?
  • 모델의 입력 데이터를 계산하는 시스템이 변경되나요? 이 경우 다음 단계를 따르세요.
    • 얼마나 자주
    • 시스템이 변경되면 어떻게 알 수 있나요?

업스트림 프로세스에서 수신하는 데이터의 자체 사본을 만드는 것이 좋습니다. 그런 다음 안전하다고 확신할 때만 업스트림 데이터의 다음 버전으로 진행합니다.

모델이 피드백 루프의 일부인가요?

모델이 자체 학습 데이터에 영향을 줄 수 있습니다. 예를 들어 일부 모델의 결과는 (직접 또는 간접적으로) 동일한 모델의 입력 기능이 됩니다.

모델이 다른 모델에 영향을 줄 수도 있습니다. 예를 들어 주가를 예측하는 두 가지 모델을 생각해 보겠습니다.

  • 나쁜 예측 모델인 모델 A
  • 모델 B

모델 A는 버그가 있으므로 실수로 주식 X를 구매하기로 결정합니다. 이러한 구매로 인해 주식 X의 가격이 상승합니다. 모델 B는 주식 X의 가격을 입력 특성으로 사용하므로 주식 X의 가치에 관한 잘못된 결론을 내릴 수 있습니다. 따라서 모델 B는 모델 A의 버그가 있는 동작을 기반으로 주식 X의 주식을 매수하거나 매도할 수 있습니다. 모델 B의 동작은 모델 A에 영향을 미쳐 튤립 과열이나 회사 X의 주가 하락을 일으킬 수 있습니다.

연습문제: 이해도 확인

다음 중 피드백 루프에 취약한 모델은 3개 중 무엇인가요?
해변의 인파를 특성 중 하나로 사용하여 해변 근처 고속도로 출구의 정체를 예측하는 교통량 예측 모델
일부 해변 방문객은 교통량 예측을 바탕으로 계획을 세웁니다. 해변 인파가 많고 교통 정체가 예상되면 많은 사람들이 대체 계획을 마련합니다. 이렇게 되면 해변 방문객 수가 줄어 예측 교통량이 적어지고 그 결과 방문객 수가 늘어나며 이렇게 계속 반복됩니다.
인기도 (즉, 책 구매 횟수)를 바탕으로 사용자가 좋아할 만한 소설을 추천하는 도서 추천 모델
책 추천은 구매를 촉진할 가능성이 높고, 이렇게 발생한 추가 판매량이 모델에 입력을 통해 반영되며, 그 결과 향후 같은 책이 추천될 확률이 높아집니다.
경쟁률(즉, 대학에 지원한 학생 중 합격자의 비율)을 기준으로 부분적으로 학교를 평가하는 대학 순위 평가 모델
모델의 순위가 상위 학교에 더 많은 관심을 일으켜 지원자 수를 증가시킬 수 있습니다. 이러한 학교가 계속해서 동일한 수의 학생을 입학시키면 선별성이 높아집니다 (입학 학생의 비율이 감소함). 이렇게 하면 학교 순위가 올라가고, 잠재적 학생의 관심이 더욱 증가하는 등 좋은 효과를 얻을 수 있습니다.
투표가 종료된 후 투표자의 2% 를 대상으로 설문조사를 실시하여 시장 선거의 당선자를 예측하는 선거 결과 모델
투표가 끝날 때까지 모델이 예측을 발표하지 않으면 예측이 투표자의 행동에 영향을 미칠 수 없습니다.
크기 (제곱미터 단위의 면적), 침실 수, 지형적 위치를 특성으로 사용하여 주택 가격을 예측하는 주택 가치 모델
가격 예측에 따라 주택의 위치, 크기, 침실 수를 빠르게 변경할 수 없으므로 피드백 루프가 존재할 수 없습니다. 하지만 크기와 침실 수 사이에는 잠재적인 상관관계가 있을 수 있으므로 이를 구분해야 할 수 있습니다 (집이 클수록 방이 더 많을 수 있음).
사진에서 사람이 웃고 있는지 감지하는 얼굴 속성 모델로, 매월 자동으로 업데이트되는 스톡 사진 데이터베이스를 기반으로 정기적으로 학습됩니다.
모델 예측은 사진 데이터베이스에 영향을 미치지 않으므로 여기에는 피드백 루프가 없습니다. 그러나 이러한 월별 업데이트가 모델에 예상치 못한 영향을 미칠 수 있으므로 입력 데이터의 버전 관리가 중요합니다.