Annonce : Tous les projets non commerciaux enregistrés pour utiliser Earth Engine avant le
15 avril 2025 devront
vérifier leur éligibilité non commerciale pour conserver leur accès. Si vous ne validez pas votre statut avant le 26 septembre 2025, votre accès pourra être suspendu.
ee.Clusterer.wekaKMeans
Restez organisé à l'aide des collections
Enregistrez et classez les contenus selon vos préférences.
Regroupez les données en clusters à l'aide de l'algorithme k-moyennes. Vous pouvez utiliser la distance euclidienne (par défaut) ou la distance de Manhattan. Si la distance de Manhattan est utilisée, les centroïdes sont calculés comme la médiane par composante plutôt que comme la moyenne. Pour en savoir plus, consultez cette page :
D. Arthur, S. Vassilvitskii : k-means++ : les avantages d'un seeding soigné. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
| Utilisation | Renvoie |
|---|
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed) | Clusterer |
| Argument | Type | Détails |
|---|
nClusters | Nombre entier | Nombre de clusters. |
init | Entier, valeur par défaut : 0 | Méthode d'initialisation à utiliser. 0 = aléatoire, 1 = k-means++, 2 = canopy, 3 = farthest first. |
canopies | Booléen, valeur par défaut : false | Utilisez des canopies pour réduire le nombre de calculs de distance. |
maxCandidates | Entier, valeur par défaut : 100 | Nombre maximal de canopées candidates à conserver en mémoire à tout moment lors de l'utilisation du clustering de canopées. La distance T2 et les caractéristiques des données détermineront le nombre de canopies candidates formées avant l'élagage périodique et final, ce qui peut entraîner une consommation excessive de mémoire. Ce paramètre permet d'éviter qu'un grand nombre de canopies candidates ne consomment de la mémoire. |
periodicPruning | Entier, par défaut : 10 000 | Fréquence d'élagage des canopées à faible densité lorsque vous utilisez le clustering de canopées. |
minDensity | Entier, valeur par défaut : 2 | Densité de canopée minimale en dessous de laquelle une canopée sera supprimée lors de l'élagage périodique, lorsque le clustering de canopées est utilisé. |
t1 | Flottant, valeur par défaut : -1,5 | Distance T1 à utiliser avec le clustering par canopée. Une valeur inférieure à 0 est considérée comme un multiplicateur positif pour T2. |
t2 | Float, valeur par défaut : -1 | Distance T2 à utiliser lors du clustering par canopée. Les valeurs inférieures à 0 entraînent l'utilisation d'une heuristique basée sur l'écart-type de l'attribut. |
distanceFunction | Chaîne, valeur par défaut : "Euclidean" | Fonction de distance à utiliser. Les options sont "Euclidienne" et "Manhattan". |
maxIterations | Entier, valeur par défaut : null | Nombre maximal d'itérations. |
preserveOrder | Booléen, valeur par défaut : false | Conservez l'ordre des instances. |
fast | Booléen, valeur par défaut : false | Permet de calculer plus rapidement les distances à l'aide de valeurs limites. Désactive le calcul/la sortie des erreurs/distances au carré. |
seed | Entier, par défaut : 10 | Graine de randomisation. |
Sauf indication contraire, le contenu de cette page est régi par une licence Creative Commons Attribution 4.0, et les échantillons de code sont régis par une licence Apache 2.0. Pour en savoir plus, consultez les Règles du site Google Developers. Java est une marque déposée d'Oracle et/ou de ses sociétés affiliées.
Dernière mise à jour le 2025/07/26 (UTC).
[null,null,["Dernière mise à jour le 2025/07/26 (UTC)."],[],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"]]