ML 시스템의 실제 사용: 암 예측

이 강의에서는 암 예측과 관련된 실제 ML 문제를* 디버그합니다.

실제 예: 암 예측

  • 환자가 의료 기록에서 '암 발병 가능성'을 예측하도록 학습함
암세포
  • 환자가 의료 기록에서 '암 발병 가능성'을 예측하도록 학습함
  • 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등이 포함됩니다.
암세포
  • 환자가 의료 기록에서 '암 발병 가능성'을 예측하도록 학습함
  • 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등이 포함됩니다.
  • 홀드아웃 테스트 데이터에서 탁월한 성능을 제공한 모델
암세포
  • 환자가 의료 기록에서 '암 발병 가능성'을 예측하도록 학습함
  • 환자의 연령, 성별, 이전 질병, 병원 이름, 활력 징후, 검사 결과 등이 포함됩니다.
  • 홀드아웃 테스트 데이터에서 탁월한 성능을 제공한 모델
  • 하지만 신규 환자를 대상으로 실시한 모델의 성능이 떨어졌습니다. 그 이유는 무엇인가요?
암세포

모델이 신규 환자에 대해 우수한 성능을 제공할 수 없다고 생각하는 이유는 무엇인가요? 문제를 파악할 수 있는지 확인한 후 아래의 재생 버튼 ▶을 클릭하여 내가 맞는지 확인하세요.

* 이 모듈은 느슨하게 (과정에 따라 일부 수정) 데이터 마이닝의 누출: 공식화, 감지, 회피: Kaufman, Rosset, Perlich를 기반으로 했습니다.