데이터 준비 및 특성 추출 절차

과정은 어떻게 진행되나요?

앞서 언급했듯이 이 과정에서는 데이터 세트를 구성하고 데이터를 변환하는 데 중점을 둡니다.

데이터 세트는 다음 태스크로 구성됩니다. 1. 원시 데이터를 수집합니다.  2. 특성 및 라벨 소스 식별 3. 샘플링 전략을 선택합니다.
4. 데이터를 분할합니다. 데이터 변환은 다음 작업으로 구성됩니다.
1. 데이터를 탐색하고 정리합니다. 2. 특성 추출 수행

주의사항:

  • 이 그림은 일반적인 프로세스를 나타내며, 이는 모든 프로젝트에 이상적이지는 않을 수 있습니다. 이 과정은 선형 회귀와 신경망에 주로 적용됩니다.
  • 표시되는 프로세스가 항상 순차적인 것은 아닙니다. 예를 들어 데이터를 변환한 후에 데이터를 분할할 수 있습니다. 데이터를 더 수집해야 할 수 있습니다. 학습이 시작된 후에도 기능적으로 어떤 기능이 효과가 있는지, 무엇이 효과가 없는지를 학습하므로 특성 세트를 수정해야 할 수도 있습니다.

시간이 얼마나 걸리나요?

다음 질문의 경우 원하는 화살표를 클릭하여 답을 확인하세요.

추측해 보세요. 머신러닝 프로젝트에서 일반적으로 데이터 준비와 변환에 얼마나 많은 시간을 사용하나요?
프로젝트 시간의 절반 이상
정답입니다. 대부분의 시간 동안 머신러닝 프로젝트를 진행하여 데이터 세트를 구성하고 데이터를 변환합니다.
프로젝트 시간의 절반 미만
추가 계획을 세우세요. 일반적으로 머신러닝 프로젝트 시간의 80% 는 데이터 세트를 구성하고 데이터를 변환하는 데 사용됩니다.