클러스터링 워크플로
데이터를 클러스터링하려면 다음 단계를 따르세요.
- 데이터를 준비합니다.
- 유사성 측정항목을 만듭니다.
- 클러스터링 알고리즘 실행
- 결과를 해석하고 클러스터링을 조정합니다.
이 페이지에서는 이 단계를 간략하게 소개합니다. 이 과정의 후반부에서
섹션으로 이동합니다.
데이터 준비
여느 ML 문제와 마찬가지로 특성 데이터를 정규화, 확장, 변환해야 함
모델을 학습시키거나 미세 조정하기 전에
이를 고려하는 것이 좋습니다 또한
준비된 데이터를 사용하여 클러스터링을 정확하게 계산할 수 있는지
차이가 있습니다.
유사성 측정항목 만들기
클러스터링 알고리즘이 데이터를 그룹화하려면 먼저
예의 쌍입니다. 다음과 같은 방법으로 예 간의 유사성을 정량화할 수 있습니다.
유사성 측정항목을 만들 수 있으며, 이를 위해서는
데이터입니다.
클러스터링 알고리즘 실행
클러스터링 알고리즘은 유사성 측정항목을 사용하여 데이터를 클러스터링합니다.
이 과정에서는 k-평균을 사용합니다.
결과 해석 및 조정
클러스터링은 '정답'을 생성하거나 포함하지 않기 때문입니다. 기준
결과를 확인할 수 있으므로 결과를 자신의 데이터와 비교하여 확인하는 것이 중요합니다.
클러스터 수준과 예시 수준 모두에서
기대치를 고려해야 합니다 결과가
이상하거나 품질이 낮다면 이전 세 단계를 실험해 보세요. 계속
출력 품질이 요구사항을 충족할 때까지 반복합니다.
달리 명시되지 않는 한 이 페이지의 콘텐츠에는 Creative Commons Attribution 4.0 라이선스에 따라 라이선스가 부여되며, 코드 샘플에는 Apache 2.0 라이선스에 따라 라이선스가 부여됩니다. 자세한 내용은 Google Developers 사이트 정책을 참조하세요. 자바는 Oracle 및/또는 Oracle 계열사의 등록 상표입니다.
최종 업데이트: 2024-07-22(UTC)
[null,null,["최종 업데이트: 2024-07-22(UTC)"],[[["Data needs to be prepared through normalization, scaling, and transformation before using it for clustering."],["A similarity metric is crucial for clustering algorithms as it quantifies how similar data points are to each other."],["The k-means algorithm is employed in this course to group data based on the defined similarity metric."],["Evaluating and adjusting clustering outcomes is an iterative process involving reviewing cluster quality and individual data point assignments."]]],[]]