ee.Clusterer.wekaKMeans

خوشه بندی داده ها با استفاده از الگوریتم k-means. می توانید از فاصله اقلیدسی (پیش فرض) یا فاصله منهتن استفاده کنید. اگر از فاصله منهتن استفاده شود، مرکزها به‌عنوان میانه مؤلفه‌ها به جای میانگین محاسبه می‌شوند. برای اطلاعات بیشتر رجوع کنید به:

D. Arthur, S. Vassilvitskii: k-means++: مزایای کاشت دقیق. در: مجموعه مقالات هجدهمین سمپوزیوم سالانه ACM-SIAM در مورد الگوریتم های گسسته، 1027-1035، 2007.

استفاده برمی گرداند
ee.Clusterer.wekaKMeans(nClusters, init , canopies , maxCandidates , periodicPruning , minDensity , t1 , t2 , distanceFunction , maxIterations , preserveOrder , fast , seed ) خوشه
استدلال تایپ کنید جزئیات
nClusters عدد صحیح تعداد خوشه ها
init عدد صحیح، پیش فرض: 0 روش مقداردهی اولیه برای استفاده 0 = تصادفی، 1 = k-means++، 2 = سایه بان، 3 = دورترین اول.
canopies بولی، پیش فرض: نادرست از سایبان ها برای کاهش تعداد محاسبات فاصله استفاده کنید.
maxCandidates عدد صحیح، پیش فرض: 100 حداکثر تعداد سایبان های کاندید برای حفظ در حافظه در هر زمان هنگام استفاده از خوشه بندی سایبان. فاصله T2 به علاوه، ویژگی های داده، تعیین می کند که چه تعداد سایبان نامزد قبل از انجام هرس دوره ای و نهایی تشکیل می شود، که ممکن است منجر به مصرف بیش از حد حافظه شود. این تنظیم از مصرف حافظه توسط تعداد زیادی سایبان نامزد جلوگیری می کند.
periodicPruning عدد صحیح، پیش فرض: 10000 هر چند وقت یکبار سایبان های با چگالی کم را هنگام استفاده از خوشه بندی سایبان هرس کنیم.
minDensity عدد صحیح، پیش فرض: 2 حداقل تراکم تاج پوشش، هنگام استفاده از خوشه بندی تاج، که در زیر آن یک سایبان در طول هرس دوره ای هرس می شود.
t1 شناور، پیش فرض: -1.5 فاصله T1 برای استفاده هنگام استفاده از خوشه بندی سایبان. مقدار < 0 به عنوان ضریب مثبت برای T2 در نظر گرفته می شود.
t2 شناور، پیش فرض: -1 فاصله T2 برای استفاده هنگام استفاده از خوشه بندی سایبان. مقادیر < 0 باعث ایجاد یک اکتشافی بر اساس ویژگی std می شود. انحراف مورد استفاده
distanceFunction رشته، پیش‌فرض: «اقلیدسی» تابع فاصله برای استفاده گزینه ها عبارتند از: اقلیدسی و منهتن.
maxIterations عدد صحیح، پیش فرض: null حداکثر تعداد تکرار
preserveOrder بولی، پیش فرض: نادرست حفظ ترتیب نمونه ها
fast بولی، پیش فرض: نادرست محاسبات مسافت سریعتر را با استفاده از مقادیر برش فعال می کند. محاسبه/خروجی مربعات خطاها/فاصله ها را غیرفعال می کند.
seed عدد صحیح، پیش فرض: 10 دانه تصادفی.