Anuncio: Todos los proyectos no comerciales registrados para usar Earth Engine antes del
15 de abril de 2025 deben
verificar su elegibilidad no comercial para mantener el acceso a Earth Engine.
ee.Clusterer.wekaKMeans
Organiza tus páginas con colecciones
Guarda y categoriza el contenido según tus preferencias.
Agrupa los datos en clústeres con el algoritmo k-means. Se puede usar la distancia euclidiana (predeterminada) o la distancia Manhattan. Si se usa la distancia Manhattan, los centroides se calculan como la mediana por componentes en lugar de la media. Para obtener más información, consulta lo siguiente:
D. Arthur, S. Vassilvitskii: k-means++: The advantages of careful seeding. En: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
Uso | Muestra |
---|
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed) | Clusterer |
Argumento | Tipo | Detalles |
---|
nClusters | Número entero | Es la cantidad de clústeres. |
init | Número entero, valor predeterminado: 0 | Es el método de inicialización que se usará. 0 = Aleatorio, 1 = K-means++, 2 = Canopy, 3 = Farthest first. |
canopies | Booleano, valor predeterminado: falso | Usa doseles para reducir la cantidad de cálculos de distancia. |
maxCandidates | Número entero, valor predeterminado: 100 | Cantidad máxima de agrupamientos candidatos que se pueden conservar en la memoria en cualquier momento cuando se usa la agrupación en clústeres de dosel. La distancia T2 y las características de los datos determinarán cuántos grupos candidatos se formarán antes de que se realicen las podas periódicas y finales, lo que podría generar un consumo excesivo de memoria. Este parámetro de configuración evita que una gran cantidad de posibles doseles consuman memoria. |
periodicPruning | Número entero. El valor predeterminado es 10000. | Frecuencia con la que se podan los doseles de baja densidad cuando se usa el agrupamiento de doseles. |
minDensity | Número entero, valor predeterminado: 2 | Es la densidad mínima de la copa cuando se usa el agrupamiento de copas, por debajo de la cual se podará una copa durante la poda periódica. |
t1 | Número de punto flotante, valor predeterminado: -1.5 | Es la distancia T1 que se usará cuando se realice el agrupamiento en clústeres de dosel. Un valor < 0 se toma como un multiplicador positivo para T2. |
t2 | Número de punto flotante, valor predeterminado: -1 | Es la distancia T2 que se debe usar cuando se usa el agrupamiento en clústeres de dosel. Los valores menores que 0 hacen que se use una heurística basada en la desviación estándar del atributo. |
distanceFunction | Cadena, valor predeterminado: "Euclidean" | Es la función de distancia que se usará. Las opciones son: euclidiana y Manhattan. |
maxIterations | Número entero, valor predeterminado: nulo | Cantidad máxima de iteraciones. |
preserveOrder | Booleano, valor predeterminado: falso | Se conserva el orden de las instancias. |
fast | Booleano, valor predeterminado: falso | Permite cálculos de distancia más rápidos con valores de corte. Inhabilita el cálculo o la salida de errores o distancias al cuadrado. |
seed | Número entero, valor predeterminado: 10 | Es la semilla de aleatorización. |
Salvo que se indique lo contrario, el contenido de esta página está sujeto a la licencia Atribución 4.0 de Creative Commons, y los ejemplos de código están sujetos a la licencia Apache 2.0. Para obtener más información, consulta las políticas del sitio de Google Developers. Java es una marca registrada de Oracle o sus afiliados.
Última actualización: 2025-07-26 (UTC)
[null,null,["Última actualización: 2025-07-26 (UTC)"],[[["\u003cp\u003eClusters data using the k-means algorithm with either Euclidean (default) or Manhattan distance.\u003c/p\u003e\n"],["\u003cp\u003eIf Manhattan distance is selected, centroids are calculated using the component-wise median instead of the mean.\u003c/p\u003e\n"],["\u003cp\u003eOffers various initialization methods including random, k-means++, canopy, and farthest first.\u003c/p\u003e\n"],["\u003cp\u003eAllows customization of distance calculation, iteration limits, and performance optimization through parameters.\u003c/p\u003e\n"]]],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"],null,["# ee.Clusterer.wekaKMeans\n\nCluster data using the k-means algorithm. Can use either the Euclidean distance (default) or the Manhattan distance. If the Manhattan distance is used, then centroids are computed as the component-wise median rather than mean. For more information see:\n\n\u003cbr /\u003e\n\nD. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.\n\n| Usage | Returns |\n|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------|\n| `ee.Clusterer.wekaKMeans(nClusters, `*init* `, `*canopies* `, `*maxCandidates* `, `*periodicPruning* `, `*minDensity* `, `*t1* `, `*t2* `, `*distanceFunction* `, `*maxIterations* `, `*preserveOrder* `, `*fast* `, `*seed*`)` | Clusterer |\n\n| Argument | Type | Details |\n|--------------------|------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| `nClusters` | Integer | Number of clusters. |\n| `init` | Integer, default: 0 | Initialization method to use. 0 = random, 1 = k-means++, 2 = canopy, 3 = farthest first. |\n| `canopies` | Boolean, default: false | Use canopies to reduce the number of distance calculations. |\n| `maxCandidates` | Integer, default: 100 | Maximum number of candidate canopies to retain in memory at any one time when using canopy clustering. T2 distance plus, data characteristics, will determine how many candidate canopies are formed before periodic and final pruning are performed, which might result in exceess memory consumption. This setting avoids large numbers of candidate canopies consuming memory. |\n| `periodicPruning` | Integer, default: 10000 | How often to prune low density canopies when using canopy clustering. |\n| `minDensity` | Integer, default: 2 | Minimum canopy density, when using canopy clustering, below which a canopy will be pruned during periodic pruning. |\n| `t1` | Float, default: -1.5 | The T1 distance to use when using canopy clustering. A value \\\u003c 0 is taken as a positive multiplier for T2. |\n| `t2` | Float, default: -1 | The T2 distance to use when using canopy clustering. Values \\\u003c 0 cause a heuristic based on attribute std. deviation to be used. |\n| `distanceFunction` | String, default: \"Euclidean\" | Distance function to use. Options are: Euclidean and Manhattan. |\n| `maxIterations` | Integer, default: null | Maximum number of iterations. |\n| `preserveOrder` | Boolean, default: false | Preserve order of instances. |\n| `fast` | Boolean, default: false | Enables faster distance calculations, using cut-off values. Disables the calculation/output of squared errors/distances. |\n| `seed` | Integer, default: 10 | The randomization seed. |"]]