Verilerinizi kümelemek için aşağıdaki adımları uygulayın:
- Verileri hazırlayın.
- Benzerlik metriği oluşturun.
- Küme oluşturma algoritmasını çalıştırın.
- Sonuçları yorumlayın ve kümelemenizi ayarlayın.
Bu sayfada adımlar kısaca açıklanmaktadır. Bu konuyu sonraki bölümlerde ayrıntılı olarak ele alacağız.
Verileri hazırlama
Herhangi bir makine öğrenimi probleminde olduğu gibi, bir modeli bu verilerle eğitmeden veya hassas ayar yapmadan önce özellik verilerini normalleştirmeniz, ölçeklendirmeniz ve dönüştürmeniz gerekir. Ayrıca, küme oluşturmadan önce, hazırlanmış verilerin örnekler arasındaki benzerliği doğru şekilde hesaplamanıza olanak tanıdığından emin olun.
Benzerlik metriği oluşturma
Küme oluşturma algoritmasının verileri gruplandırabilmesi için örnek çiftlerinin ne kadar benzer olduğunu bilmesi gerekir. Benzerlik metriği oluşturarak örnekler arasındaki benzerliği ölçebilirsiniz. Bu işlem için verilerinizi dikkatlice anlamanız gerekir.
Küme oluşturma algoritmasını çalıştırma
Küme oluşturma algoritması, verileri küme oluşturmak için benzerlik metriğini kullanır. Bu kursta k-ortalama yöntemi kullanılmaktadır.
Sonuçları yorumlama ve ayarlama
Küme oluşturma, çıktıyı doğrulayabileceğiniz temel bir "gerçek" üretmediği veya içermediği için sonucu hem küme düzeyinde hem de örnek düzeyinde beklentilerinizle karşılaştırmanız önemlidir. Sonuç tuhaf veya düşük kaliteli görünüyorsa önceki üç adımı deneyin. Çıktının kalitesi ihtiyaçlarınıza uygun olana kadar iterasyon yapmaya devam edin.