سير عمل التجميع العنقودي

لتجميع بياناتك، عليك اتّباع الخطوات التالية:

  1. تجهيز البيانات
  2. أنشئ مقياس التشابه.
  3. تشغيل خوارزمية التجميع
  4. تفسير النتائج وتعديل التجميع

تقدّم هذه الصفحة لمحة موجزة عن الخطوات. سنتناول هذه التفاصيل بالتفصيل في القسم التالي.

إعداد البيانات

كما هو الحال مع أي مشكلة في تعلُّم الآلة، عليك توحيد بيانات السمات وتحويلها وتوسيع نطاقها قبل تدريب نموذج أو تحسينه استنادًا إلى هذه البيانات. بالإضافة إلى ذلك، قبل التجميع، تأكَّد من أنّ البيانات المُعدّة تتيح لك احتساب التشابه بين الأمثلة بدقة.

إنشاء مقياس التشابه

قبل أن تتمكّن خوارزمية التجميع من تجميع البيانات، يجب أن تعرف مدى تشابه أزواج الأمثلة. يمكنك قياس التشابه بين الأمثلة من خلال إنشاء مقياس تشابه، ما يتطلّب فهمًا دقيقًا لبياناتك.

تشغيل خوارزمية التجميع

تستخدِم خوارزمية التجميع العنقودي مقياس التشابه لتجميع البيانات. تستخدِم هذه الدورة التدريبية الخوارزمية التصنيفية k-Means.

تفسير النتائج وتعديلها

بما أنّ التجميع لا ينتج أو يتضمّن "حقيقة" أساسية يمكنك مقارنة النتيجة بها، من المهم التحقّق من النتيجة مقارنةً بتوقعاتك على مستوى المجموعة وعلى مستوى المثال. إذا كانت النتيجة تبدو غريبة أو منخفضة الجودة، جرِّب الخطوات الثلاث السابقة. واصِل التعديل إلى أن تستوفي جودة النتيجة احتياجاتك.