หากต้องการจัดกลุ่มข้อมูล ให้ทำตามขั้นตอนต่อไปนี้
- เตรียมข้อมูล
- สร้างเมตริกความคล้ายคลึงกัน
- เรียกใช้อัลกอริทึมการจัดกลุ่ม
- ตีความผลลัพธ์และปรับคลัสเตอร์
หน้านี้จะแนะนำขั้นตอนต่างๆ คร่าวๆ เราจะเจาะลึกในส่วนต่อๆ ไป
เตรียมข้อมูล
คุณต้องทำให้ข้อมูลฟีเจอร์เป็นมาตรฐาน ปรับขนาด และเปลี่ยนรูปแบบข้อมูลฟีเจอร์ เช่นเดียวกับปัญหา ML ทั่วไป ก่อนการฝึกหรือปรับแต่งโมเดลของข้อมูลนั้น นอกจากนี้ ก่อนที่ คลัสเตอร์ โปรดตรวจสอบว่าข้อมูลที่เตรียมไว้ จะช่วยให้คุณสามารถคำนวณ ความคล้ายคลึงกันระหว่างตัวอย่าง
สร้างเมตริกความคล้ายคลึงกัน
ก่อนที่อัลกอริทึมการจัดกลุ่มจะจัดกลุ่มข้อมูลได้ อัลกอริทึมจำเป็นต้องทราบว่า ตัวอย่างเป็นคู่กัน คุณสามารถวัดความคล้ายคลึงระหว่างตัวอย่างได้โดย ของเมตริกความคล้ายคลึงกัน ซึ่งต้องอาศัยความเข้าใจใน
เรียกใช้อัลกอริทึมคลัสเตอร์
อัลกอริทึมการจัดกลุ่มใช้เมตริกความคล้ายคลึงกันกับข้อมูลคลัสเตอร์ หลักสูตรนี้ใช้ k-means
ตีความผลลัพธ์และปรับ
เนื่องจากการจัดกลุ่มไม่ได้ก่อให้เกิดหรือรวม "ความจริง" จากพื้นดิน เทียบกับ คุณสามารถตรวจสอบผลลัพธ์ได้ คุณจำเป็นต้องตรวจสอบผลลัพธ์เทียบกับ ทั้งในระดับคลัสเตอร์และระดับตัวอย่าง หากผลลัพธ์ ดูแปลกๆ หรือมีคุณภาพต่ำ ลองทดสอบ 3 ขั้นตอนก่อนหน้า ดำเนินการต่อ ทำซ้ำจนกว่าคุณภาพของเอาต์พุตจะตรงตามความต้องการของคุณ