이 페이지는 Cloud Translation API를 통해 번역되었습니다.

범주형 데이터 작업

를 통해 개인정보처리방침을 정의할 수 있습니다.

범주형 데이터에는 가능한 값의 특정 집합입니다. 예를 들면 다음과 같습니다.

국립공원에 서식하는 다양한 동물 종
특정 도시의 거리 이름
이메일이 스팸인지 여부
집 외벽에 칠한 색상
숫자 데이터 작업 모듈에 설명된 분류된 숫자

숫자는 범주형 데이터일 수도 있습니다.

실제 숫자 데이터는 의미 있게 곱할 수 있습니다. 예를 들어 면적을 기준으로 주택의 가치를 예측하는 모델을 생각해 보겠습니다. 주택 가격을 평가하는 데 유용한 모델은 일반적으로 살펴보겠습니다 다른 모든 조건이 같으면 200제곱미터 크기의 주택이 미터는 정사각형이 100개인 동일한 집보다 약 2배 더 가치가 있어야 함 미터

종종 정수 값을 포함하는 특성을 다음과 같이 나타내야 합니다. 숫자 데이터 대신 범주형 데이터를 사용합니다. 예를 들어 우편함이 값이 정수인 코드 특성입니다. 여러분이 범주형이 아닌 숫자로 특성을 추출해야 하는 경우 숫자 관계를 찾기 위해 우편번호를 입력하세요. 즉, 모델에 우편번호 20004를 우편번호보다 두 배 (또는 절반) 큰 신호로 처리 10002입니다. 우편번호를 범주형 데이터로 표현하면 모델이 각 개별 우편번호에 별도로 가중치를 부여합니다.

인코딩

인코딩이란 범주형 데이터 또는 기타 데이터를 모델이 학습할 수 있는 숫자 벡터로 변환하는 것을 의미합니다. 이 전환이 필요한 이유는 모델이 부동 소수점 값만 학습합니다. 학습될 수 없는 문자열과 "dog" 또는 "maple" 이 모듈에서는 카테고리 데이터의 다양한 인코딩 방법을 설명합니다.

결론 (2분)

어휘 및 원-핫 인코딩 (10분)

범주형 데이터 작업 컬렉션을 사용해 정리하기 내 환경설정을 기준으로 콘텐츠를 저장하고 분류하세요.

숫자는 범주형 데이터일 수도 있습니다.

인코딩

범주형 데이터 작업