새로운 개선된 버전의 머신러닝 단기집중과정이 2024년 8월에 제공될 예정입니다. 감사합니다
학습 세트 및 테스트 세트
플레이그라운드로 돌아가서 학습 세트와 테스트 세트로
실험해 보겠습니다.
더하기 아이콘을 클릭하면 주황색 점과 파란색 점의 의미를 다시 알아볼 수 있습니다.
시각화에서 다음을 수행합니다.
- 각 파란색 점은 한 데이터 클래스 (예: 스팸)의 한 가지 예를
나타냅니다.
- 각 주황색 점은 다른 데이터 클래스 (예: 스팸 아님)의
한 가지 예를 나타냅니다.
- 배경 색상은 모델이 예측한 해당 색상 예의
위치를 나타냅니다. 파란색 점 주위의 파란색 배경은 모델이 해당 예를 올바르게 예측하고 있음을 의미합니다. 반대로 파란색 점 주위의 배경이 주황색이면 모델이 해당 예에 대해 잘못된 예측을 하고 있음을 의미합니다.
이 연습에서는 동일한 데이터 세트에서 가져온 테스트 세트와 학습 세트를 모두
제공합니다. 기본적으로 시각화에는 학습 세트만 표시됩니다. 테스트 세트도 함께 확인하려면
시각화 바로 아래의 테스트 데이터 표시 체크박스를 클릭합니다. 시각화에서 다음과 같은 차이점에 유의하세요.
- 학습 예시는 윤곽선이 흰색입니다.
- 테스트 사례는 윤곽선이 검은색입니다.
작업 1: 다음을 실행하여 지정된 설정으로 플레이그라운드를 실행합니다.
- 실행/일시중지 버튼을 클릭합니다.
- 테스트 손실 및 학습 손실 값의 변화를 확인합니다.
- 테스트 손실 및 학습 손실 값이 더 이상 변경되지 않거나
가끔 한 번만 변경되면 실행/일시중지 버튼을 다시 눌러
플레이그라운드를 일시중지합니다.
테스트 손실과 학습 손실 간의 델타를 확인합니다. 다음 작업에서는 이 델타를 줄여 보겠습니다.
작업 2: 다음을 수행하세요.
- 재설정 버튼을 누릅니다.
- 학습률을 수정합니다.
- 실행/일시중지 버튼을 누릅니다.
- 플레이그라운드를 150에포크 이상 실행합니다.
새 학습률을 적용했을 때 테스트 손실과 학습 손실 사이의 델타 값이 낮아졌나요, 높아졌나요? 학습률과 배치 크기를 모두 수정하면 어떻게 되나요?
선택적 작업 3: 학습 데이터 비율이라는 슬라이더를 사용하면 테스트 데이터에 대한 학습 데이터 비율을 제어할 수 있습니다. 예를 들어 90%로 설정하면 데이터의 90% 는 학습 세트에, 나머지 10% 는 테스트 세트에 사용됩니다.
다음 단계를 따르세요.
- '학습 데이터 비율'을 50% 에서 10%로 줄입니다.
- 학습률과 배치 크기를 실험해 보고 결과를 기록합니다.
학습 데이터 비율을 변경하면 작업 2에서 발견한 최적의 학습 설정이 바뀌나요? 문의한 적이 있다면 이유는 무엇인가?
작업 1의 답을 보려면 더하기 아이콘을 클릭하세요.
학습률을 3 (초기 설정)으로 설정하면 테스트 손실이 학습 손실보다 훨씬 커집니다.
작업 2의 답을 보려면 더하기 아이콘을 클릭하세요.
학습률을 예를 들어 0.001로 낮추면 테스트 손실이 학습 손실에 훨씬 가까운 값으로 하락합니다. 대부분의 실행에서 배치 크기를 늘려도 학습 손실 또는 테스트 손실에 큰 영향을 미치지 않습니다. 하지만 일부 실행의 경우 배치 크기를
20 이상으로 늘릴 때 테스트 손실이 학습 손실보다 약간 낮은
값으로 하락합니다.
플레이그라운드의 데이터 세트는 무작위로 생성됩니다. 따라서 이 답이
사용자의 답과 정확히 일치하지 않을 수도 있습니다.
작업 3의 답을 보려면 더하기 아이콘을 클릭하세요.
학습 데이터 비율을 50% 에서 10% 로 줄이면 학습 세트의 데이터 포인트 수가 크게 줄어듭니다. 데이터가 너무 적고 배치 크기와 학습률이 높으면 학습 모델이 무질서하게 움직입니다 (최저점을 반복적으로 뛰어넘습니다).