خوشه بندی گردش کار

برای خوشه بندی داده های خود، این مراحل را دنبال می کنید:

  1. داده ها را آماده کنید.
  2. معیار تشابه ایجاد کنید
  3. اجرای الگوریتم خوشه بندی
  4. نتایج را تفسیر کنید و خوشه بندی خود را تنظیم کنید.

این صفحه به طور خلاصه مراحل را معرفی می کند. در بخش های بعدی به عمق خواهیم پرداخت.

داده ها را آماده کنید

مانند هر مشکل ML، شما باید قبل از آموزش یا تنظیم دقیق یک مدل بر روی آن داده، داده های ویژگی را عادی، مقیاس و تبدیل کنید. علاوه بر این، قبل از خوشه بندی، بررسی کنید که داده های آماده شده به شما امکان می دهد شباهت بین مثال ها را دقیقا محاسبه کنید.

معیار تشابه ایجاد کنید

قبل از اینکه یک الگوریتم خوشه‌بندی بتواند داده‌ها را گروه‌بندی کند، باید بداند که جفت‌های مثال چقدر شبیه هم هستند. می‌توانید شباهت بین مثال‌ها را با ایجاد یک متریک شباهت، که مستلزم درک دقیق داده‌هایتان است، کمی کنید.

اجرای الگوریتم خوشه بندی

یک الگوریتم خوشه بندی از متریک شباهت برای خوشه بندی داده ها استفاده می کند. این دوره از k-means استفاده می کند.

نتایج را تفسیر و تنظیم کنید

از آنجایی که خوشه‌بندی یک «حقیقت» پایه‌ای را ایجاد نمی‌کند یا شامل آن نمی‌شود که بتوانید برون‌داد را تأیید کنید، مهم است که نتیجه را بر اساس انتظارات خود در سطح خوشه و سطح نمونه بررسی کنید. اگر نتیجه عجیب یا بی کیفیت به نظر می رسد، سه مرحله قبلی را آزمایش کنید. به تکرار ادامه دهید تا کیفیت خروجی نیاز شما را برآورده کند.