เวิร์กโฟลว์คลัสเตอร์

หากต้องการจัดกลุ่มข้อมูล ให้ทำตามขั้นตอนต่อไปนี้

  1. เตรียมข้อมูล
  2. สร้างเมตริกความคล้ายคลึงกัน
  3. เรียกใช้อัลกอริทึมการจัดกลุ่ม
  4. ตีความผลลัพธ์และปรับคลัสเตอร์

หน้านี้จะแนะนำขั้นตอนต่างๆ คร่าวๆ เราจะเจาะลึกในส่วนต่อๆ ไป

เตรียมข้อมูล

คุณต้องทำให้ข้อมูลฟีเจอร์เป็นมาตรฐาน ปรับขนาด และเปลี่ยนรูปแบบข้อมูลฟีเจอร์ เช่นเดียวกับปัญหา ML ทั่วไป ก่อนการฝึกหรือปรับแต่งโมเดลของข้อมูลนั้น นอกจากนี้ ก่อนที่ คลัสเตอร์ โปรดตรวจสอบว่าข้อมูลที่เตรียมไว้ จะช่วยให้คุณสามารถคำนวณ ความคล้ายคลึงกันระหว่างตัวอย่าง

สร้างเมตริกความคล้ายคลึงกัน

ก่อนที่อัลกอริทึมการจัดกลุ่มจะจัดกลุ่มข้อมูลได้ อัลกอริทึมจำเป็นต้องทราบว่า ตัวอย่างเป็นคู่กัน คุณสามารถวัดความคล้ายคลึงระหว่างตัวอย่างได้โดย ของเมตริกความคล้ายคลึงกัน ซึ่งต้องอาศัยความเข้าใจใน

เรียกใช้อัลกอริทึมคลัสเตอร์

อัลกอริทึมการจัดกลุ่มใช้เมตริกความคล้ายคลึงกันกับข้อมูลคลัสเตอร์ หลักสูตรนี้ใช้ k-means

ตีความผลลัพธ์และปรับ

เนื่องจากการจัดกลุ่มไม่ได้ก่อให้เกิดหรือรวม "ความจริง" จากพื้นดิน เทียบกับ คุณสามารถตรวจสอบผลลัพธ์ได้ คุณจำเป็นต้องตรวจสอบผลลัพธ์เทียบกับ ทั้งในระดับคลัสเตอร์และระดับตัวอย่าง หากผลลัพธ์ ดูแปลกๆ หรือมีคุณภาพต่ำ ลองทดสอบ 3 ขั้นตอนก่อนหน้า ดำเนินการต่อ ทำซ้ำจนกว่าคุณภาพของเอาต์พุตจะตรงตามความต้องการของคุณ