لتجميع بياناتك، اتبع الخطوات التالية:
- إعداد البيانات.
- إنشاء مقياس التشابه.
- تنفيذ خوارزمية التجميع العنقودي.
- تفسير النتائج وضبط التجميع العنقودي.
تقدم هذه الصفحة الخطوات باختصار. سنتطرق إلى مزيد من التفاصيل في الأقسام.
تجهيز البيانات
كما هو الحال مع أي مشكلة في تعلُّم الآلة، يجب تسوية بيانات الميزات وقياسها وتحويلها. قبل تطبيق أي نموذج على تلك البيانات أو ضبطه. بالإضافة إلى ذلك، قبل التجميع العنقودي، تحقق من أن البيانات المعدة تتيح لك حساب والتشابه بين الأمثلة.
إنشاء مقياس التشابه
قبل أن تتمكن خوارزمية التجميع العنقودي من تجميع البيانات، فإنها تحتاج إلى معرفة مدى تشابه أزواج من الأمثلة. يمكنك قياس التشابه بين الأمثلة عن طريق إنشاء مقياس تماثل، الأمر الذي يتطلب فهمًا دقيقًا البيانات.
تنفيذ خوارزمية التجميع العنقودي
وتستخدم خوارزمية التجميع مقياس التشابه لتجميع البيانات. تستخدم هذه الدورة الخوارزمية التصنيفية.
تفسير النتائج وتعديلها
لأن التجميع العنقودي لا ينتج عنه "حقيقة" أساسية أو يتضمنها التي ضدك التحقق من المخرجات، فمن المهم التحقق من النتيجة مقابل التوقعات على مستوى المجموعة العنقودية وعلى مستوى المثال. إذا كانت النتيجة تبدو غريبة أو منخفضة الجودة، لذا جرب الخطوات الثلاث السابقة. متابعة والتكرار حتى تلبي جودة الإخراج احتياجاتك.