ML 실무자가 평가, 정리, 변환에 훨씬 더 많은 시간을 할애 데이터를 사용하는 방법을 배웁니다. 데이터가 매우 중요하므로 이 과정에서는 이 주제를 다음 세 가지 단원으로 정합니다.
- 수치 데이터 작업 (이 단원)
- 범주형 데이터 작업
- 데이터 세트, 일반화, 과적합
이 단원에서는 숫자 데이터 정수 또는 부동 소수점 값 의미 숫자처럼 동작합니다. 즉, 가산이고 셀 수 있고 순서가 지정되고 등등. 다음 단원에서는 범주형 데이터: 카테고리처럼 작동하는 숫자를 포함합니다. 세 번째 단원에서는 학습 및 평가 시 고품질 결과를 보장하기 위해 데이터를 준비 지정할 수 있습니다
수치 데이터의 예는 다음과 같습니다.
- 온도
- 무게
- 자연 보호 구역에서 겨울을 나는 사슴의 수
반대로 미국 우편번호가 5자리 또는 9자리 숫자인 경우, 숫자처럼 동작하거나 관계라고 할 수 있습니다. 우편번호 40004 (켄터키주 넬슨 카운티)는 워싱턴 D.C.의 우편번호 20002의 두 배가 아닙니다. 이 번호 카테고리, 특히 지리적 영역을 나타내며 학습합니다.