클러스터링 워크플로

데이터를 클러스터링하려면 다음 단계를 따르세요.

  1. 데이터를 준비합니다.
  2. 유사성 측정항목을 만듭니다.
  3. 클러스터링 알고리즘을 실행합니다.
  4. 결과를 해석하고 클러스터링을 조정합니다.

이 페이지에서는 단계를 간략하게 소개합니다. 후속 섹션에서 자세히 살펴보겠습니다.

데이터 준비

다른 ML 문제와 마찬가지로 이 데이터에서 모델을 학습하거나 미세 조정하기 전에 특성 데이터를 정규화, 조정, 변환해야 합니다. 또한 클러스터링하기 전에 준비된 데이터를 사용하여 예시 간의 유사성을 정확하게 계산할 수 있는지 확인하세요.

유사성 측정항목 만들기

클러스터링 알고리즘이 데이터를 그룹화하려면 예시 쌍이 얼마나 유사한지 알아야 합니다. 유사성 측정항목을 만들어 예시 간의 유사성을 수치화할 수 있습니다. 이때 데이터를 신중하게 이해해야 합니다.

클러스터링 알고리즘 실행

클러스터링 알고리즘은 유사성 측정항목을 사용하여 데이터를 클러스터링합니다. 이 과정에서는 k-평균을 사용합니다.

결과 해석 및 조정

클러스터링은 출력을 확인할 수 있는 기본 '진실'을 생성하거나 포함하지 않으므로 클러스터 수준과 예시 수준에서 모두 기대치와 결과를 확인하는 것이 중요합니다. 결과가 이상하거나 품질이 좋지 않은 경우 이전 세 단계를 실험해 보세요. 출력 품질이 요구사항을 충족할 때까지 반복합니다.