ee.Clusterer.wekaKMeans

使用 k-means 演算法叢集資料。可以使用歐幾里得距離 (預設) 或曼哈頓距離。如果使用曼哈頓距離,則會以元件中位數而非平均值計算質心。如需詳細資訊,請參閱:

D. Arthur, S. Vassilvitskii:k-means++:仔細播種的優點。In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.

用量傳回
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed)叢集器
引數類型詳細資料
nClusters整數叢集數量。
init整數,預設值為 0要使用的初始化方法。0 = 隨機、1 = k-means++、2 = canopy、3 = farthest first。
canopies布林值,預設值為 false使用樹冠可減少距離計算次數。
maxCandidates整數,預設值為 100使用樹冠叢集時,記憶體中可保留的候選樹冠數量上限。T2 距離加上資料特徵,會決定在執行週期性和最終修剪作業前形成多少候選樹冠,這可能會導致記憶體用量過多。這項設定可避免大量候選樹冠耗用記憶體。
periodicPruning整數,預設值為 10000使用樹冠叢集時,修剪低密度樹冠的頻率。
minDensity整數,預設值為 2使用樹冠叢集時的最低樹冠密度,低於此值時,系統會在定期修剪期間修剪樹冠。
t1浮點值,預設值為 -1.5使用樹冠叢集時要使用的 T1 距離。如果值 < 0,系統會將其視為 T2 的正乘數。
t2浮點值 (預設值為 -1)使用樹冠叢集時要使用的 T2 距離。如果值 < 0,系統會根據屬性標準差使用啟發式方法。
distanceFunction字串,預設值為「Euclidean」要使用的距離函式。選項包括:歐幾里得和曼哈頓。
maxIterations整數,預設值為 null疊代次數上限。
preserveOrder布林值,預設值為 false保留執行個體順序。
fast布林值,預設值為 false使用截斷值,加快距離計算速度。停用平方誤差/距離的計算/輸出。
seed整數,預設值為 10隨機化種子。