หากต้องการจัดกลุ่มข้อมูล ให้ทําตามขั้นตอนต่อไปนี้
- เตรียมข้อมูล
- สร้างเมตริกความคล้ายคลึง
- เรียกใช้อัลกอริทึมการจัดกลุ่ม
- ตีความผลลัพธ์และปรับการคลัสเตอร์
หน้านี้จะแนะนำขั้นตอนโดยย่อ เราจะอธิบายอย่างละเอียดในส่วนถัดไป
เตรียมข้อมูล
เช่นเดียวกับปัญหา ML อื่นๆ คุณต้องทำให้เป็นมาตรฐาน ปรับขนาด และเปลี่ยนรูปแบบข้อมูลฟีเจอร์ก่อนฝึกหรือปรับแต่งโมเดลในข้อมูลนั้น นอกจากนี้ ก่อนจัดกลุ่ม ให้ตรวจสอบว่าข้อมูลที่เตรียมไว้ช่วยให้คุณคํานวณความคล้ายคลึงระหว่างตัวอย่างได้อย่างแม่นยำ
สร้างเมตริกความคล้ายคลึง
อัลกอริทึมการจัดกลุ่มต้องทราบความคล้ายคลึงของคู่ตัวอย่างก่อนจึงจะจัดกลุ่มข้อมูลได้ คุณสามารถวัดความคล้ายคลึงกันระหว่างตัวอย่างได้โดยการสร้างเมตริกความคล้ายคลึง ซึ่งต้องใช้ความเข้าใจข้อมูลอย่างละเอียด
เรียกใช้อัลกอริทึมการจัดกลุ่ม
อัลกอริทึมการจัดกลุ่มจะใช้เมตริกความคล้ายคลึงเพื่อจัดกลุ่มข้อมูล หลักสูตรนี้ใช้ K-Means
ตีความผลลัพธ์และปรับ
เนื่องจากการจัดกลุ่มไม่ได้สร้างหรือรวม "ความจริง" พื้นฐานไว้ซึ่งคุณสามารถใช้ยืนยันเอาต์พุตได้ คุณจึงต้องตรวจสอบผลลัพธ์เทียบกับสิ่งที่คาดหวังทั้งในระดับคลัสเตอร์และระดับตัวอย่าง หากผลลัพธ์ดูแปลกๆ หรือมีคุณภาพต่ำ ให้ลองทำตาม 3 ขั้นตอนก่อนหน้า ดำเนินการซ้ำจนกว่าคุณภาพของเอาต์พุตจะตรงกับความต้องการของคุณ