모델을 처음 학습시킬 때 모든 손실 곡선이 이와 같다면 머신러닝이 좀 더 쉽게 사용할 수 있는 것입니다.
그러나 실제로는 손실 곡선을 해석하기가 매우 어려울 수 있습니다. 손실 곡선에 대한 이해를 바탕으로 다음 질문에 답하세요.
1. 모델이 학습하지 않음
친구 멜과 여러분은 계속해서 유니콘의 모습을 예측하여 일하고 있습니다.
첫 번째 손실 곡선입니다.
문제를 설명하고 멜이 어떻게 해결할 수 있는지 설명합니다.
더하기 아이콘을 클릭하여 섹션을 펼치고 답을 확인하세요.
모델이 수렴되지 않습니다. 다음 디버깅 단계를 시도해 보세요.
- 모델 디버깅의 단계에 따라 특성이 라벨을 예측할 수 있는지 확인합니다.
- 데이터 스키마와 비교하여 데이터가 잘못된 예를 감지합니다.
- 이 도표에서와 같이 학습이 불안정해 보이는 경우 모델이 매개변수 공간에서 돌아다니지 않도록 학습률을 줄입니다.
- 모델이 예측할 수 있는 10가지 예로 데이터 세트를 단순화합니다. 감소한 데이터 세트의 손실이 매우 적습니다. 그런 다음 전체 데이터 세트에서 모델을 계속 디버깅합니다.
- 모델을 간소화하고 모델이 기준보다 높은 성능을 발휘하도록 합니다. 그런 다음 점진적으로 모델을 복잡하게 만듭니다.
2. 손실이 발생했습니다.
멜은 또 다른 곡선을 보여줍니다. 어떤 문제가 있으며 어떻게 해결해야 하나요?
아래에 답변을 작성하세요.
더하기 아이콘을 클릭하여 섹션을 펼치고 답을 확인하세요.
손실이 많이 증가하는 것은 일반적으로 입력 데이터의 이상 값으로 인해 발생합니다. 가능한 원인은 다음과 같습니다.
- 입력 데이터의 NaN
- 비정상적인 데이터로 인한 그라데이션의 과도
- 0으로 나누기
- 0 또는 음수의 대수입니다.
과도한 손실을 해결하려면 배치 및 추출된 데이터에서 이상치 데이터가 있는지
확인합니다. 이상이 있는 것으로 보이면 원인을 조사하세요. 그렇지 않고 이상치가 이상 데이터처럼 보이는 경우 데이터를 셔플하여 배치 간에 이상점이 균일하게 분산되도록 하세요.
3. 내 측정항목은 모순됩니다.
멜은 다른 곡선을 그리기를 원합니다. 무엇이 문제이고
어떻게 해결할 수 있을까요? 아래에 답변을 작성하세요.
문제를 설명하고 멜이 어떻게 해결할 수 있는지 설명합니다.
더하기 아이콘을 클릭해 섹션을 펼치고 답을 확인하세요.
예시의 분류 확률은 양성 분류의 임곗값보다 높지 않으므로 재현율이 0입니다. 이러한 상황은 클래스 불균형이 큰 문제에서 종종 발생합니다. TF Keras와 같은 ML 라이브러리는 일반적으로 기본 기준을 0.5로 사용하여 분류 측정항목을 계산합니다.
다음 단계를 따르세요.
분류 임계값을 낮춥니다.
AUC와 같은 임곗값의 불변 측정항목을 확인합니다.
4. 테스트 손실이 너무 큽니다.
멜은 데이터 세트 학습 및 테스트의 손실 곡선을 보여주고 '어떤 문제야?'라고 묻습니다. 아래에 답변을 작성하세요.
문제를 설명하고 멜이 어떻게 해결할 수 있는지 설명합니다.
더하기 아이콘을 클릭하여 섹션을 펼치고 답을 확인하세요.
모델이 학습 데이터에 과적합되었습니다. 다음 단계를 따라 보세요.
- 모델 용량을 줄입니다.
- 정규화 추가
- 학습 및 테스트 분할이 통계적으로 동등한지 확인합니다.
5. 모델이 멈춤
며칠 후 멜이 또 다른 곡면으로 돌아올 때까지 기다려 주세요. 문제가 무엇인가요? 어떻게 해결할 수 있나요?
문제를 설명하고 멜이 어떻게 해결할 수 있는지 설명합니다.
더하기 아이콘을 클릭해 섹션을 펼치고 답을 확인하세요.
손실이 걸음 수와 같은 반복적인 동작을 보이고 있습니다. 모델에서 보이는 입력 데이터 자체가 반복적인 동작을 나타낼 가능성이 높습니다. 셔플이 입력 데이터에서 반복 동작을 제거하는지 확인합니다.
작동 중입니다.
"지금은 완벽하게 작동합니다." 멜이 말합니다. 의식적으로 의자에 몸을 기대며 커다란 한숨을 자릅니다. 곡선이 멋지게 보이고 성취감이 느껴집니다. 멜과 함께 모델 검증을 위한 다음 추가 확인에 대해 논의합니다.
실제 측정항목
기준치
회귀 문제의 절대 손실
분류 문제에 대한 다른 측정항목