برای خوشه بندی داده های خود، این مراحل را دنبال می کنید:
- داده ها را آماده کنید.
- معیار تشابه ایجاد کنید
- اجرای الگوریتم خوشه بندی
- نتایج را تفسیر کنید و خوشه بندی خود را تنظیم کنید.
این صفحه به طور خلاصه مراحل را معرفی می کند. در بخش های بعدی به عمق خواهیم پرداخت.
داده ها را آماده کنید
مانند هر مشکل ML، شما باید قبل از آموزش یا تنظیم دقیق یک مدل بر روی آن داده، داده های ویژگی را عادی، مقیاس و تبدیل کنید. علاوه بر این، قبل از خوشه بندی، بررسی کنید که داده های آماده شده به شما امکان می دهد شباهت بین مثال ها را دقیقا محاسبه کنید.
معیار تشابه ایجاد کنید
قبل از اینکه یک الگوریتم خوشهبندی بتواند دادهها را گروهبندی کند، باید بداند که جفتهای مثال چقدر شبیه هم هستند. میتوانید شباهت بین مثالها را با ایجاد یک متریک شباهت، که مستلزم درک دقیق دادههایتان است، کمی کنید.
اجرای الگوریتم خوشه بندی
یک الگوریتم خوشه بندی از متریک شباهت برای خوشه بندی داده ها استفاده می کند. این دوره از k-means استفاده می کند.
نتایج را تفسیر و تنظیم کنید
از آنجایی که خوشهبندی یک «حقیقت» پایهای را ایجاد نمیکند یا شامل آن نمیشود که بتوانید برونداد را تأیید کنید، مهم است که نتیجه را بر اساس انتظارات خود در سطح خوشه و سطح نمونه بررسی کنید. اگر نتیجه عجیب یا بی کیفیت به نظر می رسد، سه مرحله قبلی را آزمایش کنید. به تکرار ادامه دهید تا کیفیت خروجی نیاز شما را برآورده کند.