เวิร์กโฟลว์คลัสเตอร์

หากต้องการจัดกลุ่มข้อมูล ให้ทําตามขั้นตอนต่อไปนี้

  1. เตรียมข้อมูล
  2. สร้างเมตริกความคล้ายคลึง
  3. เรียกใช้อัลกอริทึมการจัดกลุ่ม
  4. ตีความผลลัพธ์และปรับการคลัสเตอร์

หน้านี้จะแนะนำขั้นตอนโดยย่อ เราจะอธิบายอย่างละเอียดในส่วนถัดไป

เตรียมข้อมูล

เช่นเดียวกับปัญหา ML อื่นๆ คุณต้องทำให้เป็นมาตรฐาน ปรับขนาด และเปลี่ยนรูปแบบข้อมูลฟีเจอร์ก่อนฝึกหรือปรับแต่งโมเดลในข้อมูลนั้น นอกจากนี้ ก่อนจัดกลุ่ม ให้ตรวจสอบว่าข้อมูลที่เตรียมไว้ช่วยให้คุณคํานวณความคล้ายคลึงระหว่างตัวอย่างได้อย่างแม่นยำ

สร้างเมตริกความคล้ายคลึง

อัลกอริทึมการจัดกลุ่มต้องทราบความคล้ายคลึงของคู่ตัวอย่างก่อนจึงจะจัดกลุ่มข้อมูลได้ คุณสามารถวัดความคล้ายคลึงกันระหว่างตัวอย่างได้โดยการสร้างเมตริกความคล้ายคลึง ซึ่งต้องใช้ความเข้าใจข้อมูลอย่างละเอียด

เรียกใช้อัลกอริทึมการจัดกลุ่ม

อัลกอริทึมการจัดกลุ่มจะใช้เมตริกความคล้ายคลึงเพื่อจัดกลุ่มข้อมูล หลักสูตรนี้ใช้ K-Means

ตีความผลลัพธ์และปรับ

เนื่องจากการจัดกลุ่มไม่ได้สร้างหรือรวม "ความจริง" พื้นฐานไว้ซึ่งคุณสามารถใช้ยืนยันเอาต์พุตได้ คุณจึงต้องตรวจสอบผลลัพธ์เทียบกับสิ่งที่คาดหวังทั้งในระดับคลัสเตอร์และระดับตัวอย่าง หากผลลัพธ์ดูแปลกๆ หรือมีคุณภาพต่ำ ให้ลองทำตาม 3 ขั้นตอนก่อนหน้า ดำเนินการซ้ำจนกว่าคุณภาพของเอาต์พุตจะตรงกับความต้องการของคุณ