หากต้องการจัดกลุ่มข้อมูล ให้ทําตามขั้นตอนต่อไปนี้
- เตรียมข้อมูล
- สร้างเมตริกที่คล้ายกัน
- เรียกใช้อัลกอริทึมการจัดกลุ่ม
- ตีความผลลัพธ์และปรับคลัสเตอร์
หน้านี้จะแนะนําขั้นตอนโดยสรุป เราจะเจาะลึกในส่วนถัดไป
เตรียมข้อมูล
เช่นเดียวกับปัญหาของ ML คุณต้องปรับข้อมูล ปรับขนาด และเปลี่ยนรูปแบบข้อมูลให้เป็นมาตรฐาน อย่างไรก็ตาม ขณะรวมกลุ่ม ต้องมีการตรวจสอบด้วยว่า ข้อมูลความพร้อมช่วยให้คุณคํานวณความคล้ายคลึงกันระหว่างตัวอย่างได้อย่างแม่นยํา ส่วนถัดไปพูดถึง การพิจารณานี้
สร้างเมตริกที่คล้ายกัน
ก่อนที่อัลกอริทึมการจัดกลุ่มจะจัดกลุ่มข้อมูลได้ ระบบจึงต้องทราบว่าตัวอย่างที่คล้ายกันเป็นเท่าใด คุณวัดความคล้ายคลึงระหว่างตัวอย่างได้โดยการสร้างเมตริกความคล้ายคลึง ในการสร้างเมตริกที่คล้ายกัน คุณจะต้องทําความเข้าใจข้อมูลอย่างละเอียดและวิธีที่จะดึงความคล้ายคลึงกันจากฟีเจอร์ต่างๆ มาใช้
เรียกใช้อัลกอริทึมการจัดกลุ่ม
อัลกอริทึมการจัดกลุ่มใช้เมตริกความคล้ายคลึงกันเพื่อจัดกลุ่มข้อมูล หลักสูตรนี้มุ่งเน้นที่ K-Mean
แปลความหมายผลลัพธ์และปรับ
การตรวจสอบคุณภาพของเอาต์พุตของคลัสเตอร์จะเป็นแบบทําซ้ําและการสํารวจ เนื่องจากการจัดกลุ่มไม่มี "ความจริง" ที่ยืนยันเอาต์พุตได้ คุณตรวจสอบผลลัพธ์กับความคาดหวังที่ระดับคลัสเตอร์และระดับตัวอย่าง การปรับปรุงผลลัพธ์ต้องใช้การทดสอบกับขั้นตอนก่อนหน้านี้ซ้ําๆ เพื่อดูว่ามีผลต่อคลัสเตอร์อย่างไร