데이터 세트, 일반화, 과적합: 지식 테스트

  1. 다음 중 고정된 데이터 세트의 예는 무엇인가요?

  2. year, model, mileage 특성이 포함된 데이터 세트를 사용하여 중고차의 할인가를 예측하기 위한 모델을 학습시키고 있습니다. 데이터 세트를 검사하면 2,500개 예시 중 150개에서 마일리지 값이 누락되었음을 알게 됩니다. 다음 중 합리적인 조치는 무엇일까요? 해당되는 항목을 모두 선택해 주세요.

    적절한 답변을 모두 선택합니다.

  3. 사용자가 특정 영화를 즐길지 여부를 예측하기 위해 스트리밍 서비스의 영화 추천 모델을 학습시키고 있습니다. 다음 중 '사용자가 영화를 즐겼음'에 적합한 프록시 라벨은 무엇인가요? 해당되는 항목을 모두 선택해 주세요.

    적절한 답변을 모두 선택합니다.

  4. 참 또는 거짓: 테스트 데이터에서 낮은 손실 값을 달성할 때까지 모델을 학습시키면 과적합을 효과적으로 방지할 수 있습니다.

  5. 다음 문장의 빈칸을 채워 넣으세요.
    정규화는 학습 중에 ___에 페널티를 적용함으로써 모델이 새로운 데이터에 맞게 일반화하는 능력을 향상합니다.