데이터를 클러스터링하려면 다음 단계를 따르세요.
- 데이터를 준비합니다.
- 유사성 측정항목을 만듭니다.
- 클러스터링 알고리즘 실행
- 결과를 해석하고 클러스터링을 조정합니다.
이 페이지에서는 이 단계를 간략하게 소개합니다. 이 과정의 후반부에서 섹션으로 이동합니다.
데이터 준비
여느 ML 문제와 마찬가지로 특성 데이터를 정규화, 확장, 변환해야 함 모델을 학습시키거나 미세 조정하기 전에 이를 고려하는 것이 좋습니다 또한 준비된 데이터를 사용하여 클러스터링을 정확하게 계산할 수 있는지 차이가 있습니다.
유사성 측정항목 만들기
클러스터링 알고리즘이 데이터를 그룹화하려면 먼저 예의 쌍입니다. 다음과 같은 방법으로 예 간의 유사성을 정량화할 수 있습니다. 유사성 측정항목을 만들 수 있으며, 이를 위해서는 데이터입니다.
클러스터링 알고리즘 실행
클러스터링 알고리즘은 유사성 측정항목을 사용하여 데이터를 클러스터링합니다. 이 과정에서는 k-평균을 사용합니다.
결과 해석 및 조정
클러스터링은 '정답'을 생성하거나 포함하지 않기 때문입니다. 기준 결과를 확인할 수 있으므로 결과를 자신의 데이터와 비교하여 확인하는 것이 중요합니다. 클러스터 수준과 예시 수준 모두에서 기대치를 고려해야 합니다 결과가 이상하거나 품질이 낮다면 이전 세 단계를 실험해 보세요. 계속 출력 품질이 요구사항을 충족할 때까지 반복합니다.