Aby grupować dane:
- Przygotuj dane.
- Utwórz dane podobieństwa.
- Uruchom algorytm grupowania.
- Zinterpretuj wyniki i dostosuj grupowanie.
Na tej stronie znajduje się krótkie omówienie tych czynności. Później omówimy szczegółowo, sekcji.
Przygotuj dane
Tak jak w przypadku każdego problemu ML, musisz normalizować, skalować i przekształcać dane cech przed wytrenowaniem modelu na podstawie tych danych lub jego dostrojeniem. Ponadto przed należy sprawdzać, czy przygotowane dane umożliwiają precyzyjne obliczenie podobieństwo między przykładami.
Utwórz dane podobieństwa
Zanim algorytm grupowania będzie mógł grupować dane, musi określić, jak podobne możesz używać par przykładów. Możesz określić ilościowo podobieństwo między przykładami, aby utworzyć wskaźnik podobieństwa, który wymaga dokładnego zrozumienia i skalowalnych danych.
Uruchom algorytm grupowania
Algorytm grupowania używa wskaźnika podobieństwa do danych w klastrze. W tym kursie posługujemy się k-średnimi.
Interpretowanie wyników i dostosowywanie
Ponieważ grupowanie nie tworzy ani nie zawiera podstawowej „prawdy” w odniesieniu do których można zweryfikować dane wyjściowe, należy porównywać je z zarówno na poziomie klastra, jak i na poziomie przykładu. Jeśli wynik wyglądają dziwnie lub mają niską jakość, poeksperymentuj z 3 poprzednimi krokami. Dalej powtarzając te czynności, aż jakość wyników będzie odpowiadała Twoim potrzebom.