ee.Clusterer.wekaKMeans

Кластеризация данных с помощью алгоритма k-средних. Можно использовать как евклидово расстояние (по умолчанию), так и манхэттенское расстояние. При использовании манхэттенского расстояния центроиды вычисляются как покомпонентная медиана, а не как среднее значение. Подробнее см.:

Д. Артур, С. Васильвицкий: k-means++: преимущества тщательного посева. В: Труды восемнадцатого ежегодного симпозиума ACM-SIAM по дискретным алгоритмам, 1027–1035, 2007.

Использование Возврат
ee.Clusterer.wekaKMeans(nClusters, init , canopies , maxCandidates , periodicPruning , minDensity , t1 , t2 , distanceFunction , maxIterations , preserveOrder , fast , seed ) Кластеризатор
Аргумент Тип Подробности
nClusters Целое число Количество кластеров.
init Целое число, по умолчанию: 0 Метод инициализации, который следует использовать. 0 = случайный, 1 = k-means++, 2 = полог, 3 = самый дальний первый.
canopies Логическое значение, по умолчанию: false Используйте навесы, чтобы сократить количество расчетов расстояний.
maxCandidates Целое число, по умолчанию: 100 Максимальное количество потенциальных пологов, сохраняемых в памяти одновременно при кластеризации пологов. Расстояние T2 плюс характеристики данных определяют количество потенциальных пологов, сформированных до выполнения периодической и окончательной обрезки, что может привести к чрезмерному потреблению памяти. Этот параметр позволяет избежать потребления памяти большим количеством потенциальных пологов.
periodicPruning Целое число, по умолчанию: 10000 Как часто следует обрезать низкоплотные пологи при группировании полога.
minDensity Целое число, по умолчанию: 2 Минимальная плотность полога при группировании полога, ниже которой полог будет обрезаться во время периодической обрезки.
t1 Плавающий, по умолчанию: -1,5 Расстояние T1, используемое при кластеризации полога. Значение < 0 принимается как положительный множитель для T2.
t2 Плавающее число, по умолчанию: -1 Расстояние T2, используемое при кластеризации полога. Значения < 0 приводят к использованию эвристики, основанной на стандартном отклонении атрибута.
distanceFunction Строка, по умолчанию: «Евклидова» Используемая функция расстояния. Возможные варианты: евклидово и манхэттенское.
maxIterations Целое число, по умолчанию: null Максимальное количество итераций.
preserveOrder Логическое значение, по умолчанию: false Сохраняйте порядок экземпляров.
fast Логическое значение, по умолчанию: false Позволяет ускорить расчёт расстояний, используя пороговые значения. Отключает расчёт/вывод квадратов ошибок/расстояний.
seed Целое число, по умолчанию: 10 Рандомизирующее семя.