Verilerinizi kümelemek için şu adımları uygularsınız:
- Verileri hazırlama
- Benzerlik metriği oluşturun.
- Kümeleme algoritması çalıştırın.
- Sonuçları yorumlayın ve kümelemeyi ayarlayın.
Bu sayfada adımlar kısaca açıklanmaktadır. Sonraki videoda daha sonra bölümlerini kontrol edin.
Verileri hazırlama
Tüm makine öğrenimi problemlerinde olduğu gibi özellik verilerini normalleştirmeniz, ölçeklendirmeniz ve dönüştürmeniz gerekir. ve gerekli düzeltmeleri yapmalısınız. Ayrıca, kümeleme için hazırladığınız verilerin doğru hesaplama yapmanıza olanak tanıdığından irdeleyelim ve karşılaştıralım.
Benzerlik metriği oluştur
Bir kümeleme algoritmasının verileri gruplamadan önce, bir algoritmanın ne kadar benzer bilmeniz gerekir. Örnekler arasındaki benzerliği ölçmek için benzerlik metriği oluşturmaya çalışın ve bu metrik, dışı verilerdir.
Kümeleme algoritmasını çalıştırma
Kümeleme algoritması, verileri kümelemek için benzerlik metriğini kullanır. Bu kursta k-ortalaması kullanılmaktadır.
Sonuçları yorumlama ve ayarlama
Çünkü kümeleme bir "gerçeği" üretmez veya içermez karşınızdakinin emin olmak istiyorsanız, sonucu doğrulama ve analiz etme hem küme düzeyinde hem de örnek düzeyinde gerçekleştirebilirsiniz. Sonuç tuhaf veya düşük kalitede görünüyorsa önceki üç adımı deneyin. Devam et ve çıktının kalitesi ihtiyaçlarınızı karşılayana kadar sürekli ilerler.