Alur kerja pengelompokan

Untuk mengelompokkan data, Anda harus mengikuti langkah-langkah berikut:

  1. Menyiapkan data.
  2. Buat metrik kesamaan.
  3. Menjalankan algoritma pengelompokan.
  4. Menafsirkan hasil dan menyesuaikan pengelompokan Anda.

Halaman ini memperkenalkan langkah-langkahnya secara singkat. Kita akan membahasnya lebih lanjut di bagian berikutnya.

Menyiapkan data

Seperti masalah ML lainnya, Anda harus melakukan normalisasi, penskalaan, dan transformasi data fitur sebelum melatih atau menyesuaikan model pada data tersebut. Selain itu, sebelum mengelompokkan, pastikan data yang disiapkan memungkinkan Anda menghitung kemiripan antara contoh secara akurat.

Membuat metrik kesamaan

Sebelum dapat mengelompokkan data, algoritma pengelompokan perlu mengetahui seberapa mirip pasangan contoh. Anda dapat mengukur kesamaan antara contoh dengan membuat metrik kesamaan, yang memerlukan pemahaman yang cermat tentang data Anda.

Menjalankan algoritma pengelompokan

Algoritma pengelompokan menggunakan metrik kesamaan untuk mengelompokkan data. Kursus ini menggunakan k-means.

Menafsirkan hasil dan menyesuaikan

Karena pengelompokan tidak menghasilkan atau menyertakan "kebenaran" dasar yang dapat Anda gunakan untuk memverifikasi output, penting untuk memeriksa hasilnya berdasarkan ekspektasi Anda di tingkat cluster dan tingkat contoh. Jika hasilnya terlihat aneh atau berkualitas rendah, lakukan eksperimen dengan tiga langkah sebelumnya. Lanjutkan iterasi hingga kualitas output memenuhi kebutuhan Anda.