ولأنّ التجميع غير خاضع للإشراف، لا يتوفّر حقيقة أساسية للتحقّق من النتائج. ويؤدي عدم توفّر الحقيقة إلى تعقيد تقييمات الجودة. بالإضافة إلى ذلك، لا تقدّم مجموعات البيانات في العالم الواقعي عادةً مجموعات واضحة من الأمثلة كما هو الحال في المثال الموضّح في الشكل 1.

بدلاً من ذلك، غالبًا ما تبدو البيانات الواقعية أقرب إلى الشكل 2، ما يجعل من الصعب تقييم جودة التجميع بصريًا.

ومع ذلك، هناك أساليب استقرائية وأفضل الممارسات التي يمكنك تطبيقها بشكل متكرّر لتحسين جودة التجميع. تقدّم المخطّط البياني التالي نظرة عامة على كيفية تقييم نتائج التجميع. سنوضّح كل خطوة بالتفصيل.
الخطوة 1: تقييم جودة التجميع
تأكَّد أولاً من أنّ المجموعات العنقودية تبدو على النحو المتوقّع، وأنّ الأمثلة التي تعتقد أنّها متشابهة تظهر في المجموعة العنقودية نفسها.
بعد ذلك، اطّلِع على المقاييس المستخدَمة بشكل شائع (هذه القائمة ليست شاملة):
- عدد القيم الفريدة للسمة
- مقدار المجموعة
- أداء عمليات التنزيل
عدد القيم الفريدة للسمة
عدد القيم الفريدة للمجموعة هو عدد النماذج لكل مجموعة. أنشئ رسمًا بيانيًا لكثافة cardinality للمجموعات العنقودية لجميع المجموعات، وابحث عن المجموعات التي تُعدّ قيمًا خارجية كبيرة. في الشكل 2، ستكون هذه المجموعة 5.

مقدار المجموعة
حجم المجموعة هو مجموع المسافات من جميع الأمثلة في مجموعة إلى النقطة المركزية للمجموعة. يمكنك رسم حجم المجموعة لجميع المجموعات ومحاولة معرفة القيم الشاذة. في الشكل 3، المجموعة 0 هي قيمة شاذة.
ننصحك أيضًا بالاطّلاع على أقصى مسافة أو متوسّط المسافة بين الأمثلة والنقاط المركزية، حسب المجموعة، للعثور على القيم الشاذة.

الحجم مقارنةً بعدد القيم الفريدة للسمة
ربما لاحظت أنّ عدد القيم الفريدة للسمة في المجموعة يرتبط بقيمة أكبر لمقياس المجموعة، وهو ما يُعتبر منطقيًا، لأنّه كلما زاد عدد النقاط في المجموعة (عدد القيم الفريدة للسمة)، زاد مجموع القيم المحتمَلة لمسافات تلك النقاط عن مركز الكتلة (مقياس المجموعة). يمكنك أيضًا تحديد المجموعات الشاذة من خلال البحث عن المجموعات التي تكون فيها هذه العلاقة بين عدد القيم الفريدة وحجم المجموعة مختلفة جدًا عن المجموعات الأخرى. في الشكل 4، يشير تطابق خط مع مخطّط عدد القيم الفريدة للمتغير وحجمها إلى أنّ المجموعة 0 شاذة. (المجموعة 5 بعيدة أيضًا عن الخط، ولكن في حال حذف المجموعة 0، سيكون الخط الجديد الذي تم تعديله أقرب بكثير إلى المجموعة 5).

أداء عمليات التنزيل
بما أنّه يتم استخدام نواتج التجميع غالبًا في أنظمة تعلُّم الآلة في مرحلة ما بعد المعالجة، تحقّق مما إذا كان أداء النموذج في مرحلة ما بعد المعالجة يتحسن عند تغيير عملية التجميع. يقدّم ذلك تقييمًا واقعيًا لجودة نتائج التجميع، مع أنّ إجراء هذا النوع من الاختبارات قد يكون معقّدًا ومكلفًا.
الخطوة 2: إعادة تقييم مقياس التشابه
تعتمد جودة خوارزمية التجميع على جودة مقياس التشابه. تأكَّد من أنّه يعرض مقياس التشابه نتائج منطقية. يمكنك إجراء عملية تحقّق سريعة من خلال تحديد أزواج من الأمثلة المعروف أنّها متشابهة إلى حدّ ما. احتسِب قياس التشابه لكل زوج من الأمثلة، وقارِن نتائجك بمعرفة: يجب أن يكون لزوجات الأمثلة المتشابهة قياس تشابه أعلى من زوجات الأمثلة غير المتشابهة.
يجب أن تكون الأمثلة التي تستخدِمها للتحقّق من صحة مقياس التشابه تمثل مجموعة البيانات، حتى تكون واثقًا من أنّ مقياس التشابه ينطبق على جميع أمثلة المحتوى. يجب أن يكون أداء قياس التشابه، سواء كان يدويًا أو خاضعًا للإشراف، متسقًا في مجموعة بياناتك. إذا كان مقياس التشابه غير متّسق لبعض الأمثلة، لن يتم تجميع تلك المثال مع أمثلة مشابهة.
إذا عثرت على أمثلة ذات نتائج تشابه غير دقيقة، من المحتمل أنّ مقياس التشابه لا يرصد بالكامل بيانات العناصر التي تميّز تلك الأمثلة. جرِّب مقياس التشابه إلى أن يعرض نتائج أكثر دقة واتساقًا.
الخطوة 3: العثور على العدد الأمثل للمجموعات
تتطلّب منك خوارزمية k-means تحديد عدد المجموعات العنقودية مسبقًا. كيف تحدّد الأمثل؟ حاوِل تشغيل الخوارزمية باستخدام قيم متزايدة من ولاحظ مجموع جميع قيم كثافة الكتلة. مع زيادة ، تصبح المجموعات العنقودية أصغر، وتقلّ المسافة الإجمالية بين النقاط ومراكزها. يمكننا اعتبار إجمالي هذه المسافة خسارة. ارسم هذه المسافة مقابل عدد المجموعات.
كما هو موضّح في الشكل 5، فوق قيمة معيّنة من ، يصبح الانخفاض في الخسارة هامشيًا مع زيادة . ننصحك باستخدام حيث يحدث تغيُّر كبير في الانحدار أولاً، ما يُعرف باسم طريقة المرفق. بالنسبة إلى المخطّط المعروض، تكون القيمة المثلى 11 تقريبًا. إذا كنت تفضّل مجموعات أكثر دقة، يمكنك اختيار قيمة أعلى ، مع الرجوع إلى الرسم البياني هذا.

أسئلة حول تحديد المشاكل وحلّها
إذا رصدت مشاكل أثناء التقييم، أعِد تقييم خطوات إعداد البيانات ومقياس التشابه الذي اخترته. سؤال:
- هل تمّ توسيع نطاق بياناتك بشكلٍ مناسب؟
- هل مقياس التشابه صحيح؟
- هل تُجري الخوارزمية عمليات ذات معنى دلالي على البيانات؟
- هل تتطابق افتراضات الخوارزمية مع البيانات؟