Annuncio: tutti i progetti non commerciali registrati per l'utilizzo di Earth Engine prima del
15 aprile 2025 devono
verificare l'idoneità non commerciale per mantenere l'accesso a Earth Engine.
ee.Clusterer.wekaKMeans
Mantieni tutto organizzato con le raccolte
Salva e classifica i contenuti in base alle tue preferenze.
Raggruppa i dati utilizzando l'algoritmo k-means. Può utilizzare la distanza euclidea (impostazione predefinita) o la distanza di Manhattan. Se viene utilizzata la distanza di Manhattan, i centroidi vengono calcolati come mediana componente per componente anziché come media. Per ulteriori informazioni, vedi:
D. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
Utilizzo | Resi |
---|
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed) | Clusterer |
Argomento | Tipo | Dettagli |
---|
nClusters | Numero intero | Numero di cluster. |
init | Numero intero, valore predefinito: 0 | Metodo di inizializzazione da utilizzare. 0 = casuale, 1 = k-means++, 2 = canopy, 3 = farthest first. |
canopies | Booleano, valore predefinito: false | Utilizza i baldacchini per ridurre il numero di calcoli della distanza. |
maxCandidates | Numero intero, valore predefinito: 100 | Numero massimo di canopie candidate da conservare in memoria in qualsiasi momento quando utilizzi il clustering delle canopie. La distanza T2 più le caratteristiche dei dati determineranno il numero di chiome candidate che vengono formate prima che vengano eseguite le potature periodiche e finali, il che potrebbe comportare un consumo eccessivo di memoria. Questa impostazione evita che un numero elevato di chiome candidate consumi memoria. |
periodicPruning | Numero intero, valore predefinito: 10000 | Frequenza di potatura delle chiome a bassa densità quando si utilizza il clustering delle chiome. |
minDensity | Numero intero, valore predefinito: 2 | Densità minima della chioma, quando si utilizza il clustering delle chiome, al di sotto della quale una chioma verrà potata durante la potatura periodica. |
t1 | Float, valore predefinito: -1,5 | La distanza T1 da utilizzare quando si utilizza il clustering canopy. Un valore < 0 viene considerato un moltiplicatore positivo per T2. |
t2 | Float, valore predefinito: -1 | La distanza T2 da utilizzare quando si utilizza il clustering canopy. I valori < 0 causano l'utilizzo di un'euristica basata sulla deviazione standard dell'attributo. |
distanceFunction | Stringa, valore predefinito: "Euclidea" | Funzione di distanza da utilizzare. Le opzioni sono: euclidea e Manhattan. |
maxIterations | Numero intero, valore predefinito: null | Numero massimo di iterazioni. |
preserveOrder | Booleano, valore predefinito: false | Conserva l'ordine delle istanze. |
fast | Booleano, valore predefinito: false | Consente calcoli della distanza più rapidi, utilizzando valori limite. Disattiva il calcolo/l'output di errori/distanze al quadrato. |
seed | Numero intero, valore predefinito: 10 | Il seed di randomizzazione. |
Salvo quando diversamente specificato, i contenuti di questa pagina sono concessi in base alla licenza Creative Commons Attribution 4.0, mentre gli esempi di codice sono concessi in base alla licenza Apache 2.0. Per ulteriori dettagli, consulta le norme del sito di Google Developers. Java è un marchio registrato di Oracle e/o delle sue consociate.
Ultimo aggiornamento 2025-07-26 UTC.
[null,null,["Ultimo aggiornamento 2025-07-26 UTC."],[[["\u003cp\u003eClusters data using the k-means algorithm with either Euclidean (default) or Manhattan distance.\u003c/p\u003e\n"],["\u003cp\u003eIf Manhattan distance is selected, centroids are calculated using the component-wise median instead of the mean.\u003c/p\u003e\n"],["\u003cp\u003eOffers various initialization methods including random, k-means++, canopy, and farthest first.\u003c/p\u003e\n"],["\u003cp\u003eAllows customization of distance calculation, iteration limits, and performance optimization through parameters.\u003c/p\u003e\n"]]],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"],null,["# ee.Clusterer.wekaKMeans\n\nCluster data using the k-means algorithm. Can use either the Euclidean distance (default) or the Manhattan distance. If the Manhattan distance is used, then centroids are computed as the component-wise median rather than mean. For more information see:\n\n\u003cbr /\u003e\n\nD. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.\n\n| Usage | Returns |\n|---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|-----------|\n| `ee.Clusterer.wekaKMeans(nClusters, `*init* `, `*canopies* `, `*maxCandidates* `, `*periodicPruning* `, `*minDensity* `, `*t1* `, `*t2* `, `*distanceFunction* `, `*maxIterations* `, `*preserveOrder* `, `*fast* `, `*seed*`)` | Clusterer |\n\n| Argument | Type | Details |\n|--------------------|------------------------------|-----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------|\n| `nClusters` | Integer | Number of clusters. |\n| `init` | Integer, default: 0 | Initialization method to use. 0 = random, 1 = k-means++, 2 = canopy, 3 = farthest first. |\n| `canopies` | Boolean, default: false | Use canopies to reduce the number of distance calculations. |\n| `maxCandidates` | Integer, default: 100 | Maximum number of candidate canopies to retain in memory at any one time when using canopy clustering. T2 distance plus, data characteristics, will determine how many candidate canopies are formed before periodic and final pruning are performed, which might result in exceess memory consumption. This setting avoids large numbers of candidate canopies consuming memory. |\n| `periodicPruning` | Integer, default: 10000 | How often to prune low density canopies when using canopy clustering. |\n| `minDensity` | Integer, default: 2 | Minimum canopy density, when using canopy clustering, below which a canopy will be pruned during periodic pruning. |\n| `t1` | Float, default: -1.5 | The T1 distance to use when using canopy clustering. A value \\\u003c 0 is taken as a positive multiplier for T2. |\n| `t2` | Float, default: -1 | The T2 distance to use when using canopy clustering. Values \\\u003c 0 cause a heuristic based on attribute std. deviation to be used. |\n| `distanceFunction` | String, default: \"Euclidean\" | Distance function to use. Options are: Euclidean and Manhattan. |\n| `maxIterations` | Integer, default: null | Maximum number of iterations. |\n| `preserveOrder` | Boolean, default: false | Preserve order of instances. |\n| `fast` | Boolean, default: false | Enables faster distance calculations, using cut-off values. Disables the calculation/output of squared errors/distances. |\n| `seed` | Integer, default: 10 | The randomization seed. |"]]