Ankündigung: Alle nicht kommerziellen Projekte, die vor dem
15. April 2025 für die Nutzung von Earth Engine registriert wurden, müssen
die Berechtigung zur nicht kommerziellen Nutzung bestätigen, um den Zugriff aufrechtzuerhalten. Wenn Sie Ihren Status nicht bis zum 26. September 2025 bestätigen, wird Ihr Zugriff möglicherweise eingeschränkt.
ee.Clusterer.wekaKMeans
Mit Sammlungen den Überblick behalten
Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.
Daten mit dem k-Means-Algorithmus in Clustern gruppieren. Sie können entweder die euklidische Distanz (Standard) oder die Manhattan-Distanz verwenden. Wenn die Manhattan-Distanz verwendet wird, werden die Schwerpunkte als komponentenweiser Median und nicht als Mittelwert berechnet. Weitere Informationen erhalten Sie hier:
D. Arthur, S. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
| Nutzung | Ausgabe |
|---|
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed) | Clusterer |
| Argument | Typ | Details |
|---|
nClusters | Ganzzahl | Anzahl der Cluster. |
init | Ganzzahl, Standardwert: 0 | Zu verwendende Initialisierungsmethode. 0 = zufällig, 1 = k-means++, 2 = Canopy, 3 = Farthest First. |
canopies | Boolescher Wert, Standard: „false“ | Verwenden Sie Canopies, um die Anzahl der Distanzberechnungen zu reduzieren. |
maxCandidates | Ganzzahl, Standard: 100 | Maximale Anzahl von Kandidaten-Canopies, die bei der Verwendung von Canopy-Clustering gleichzeitig im Arbeitsspeicher behalten werden sollen. Der T2-Abstand plus die Datenmerkmale bestimmen, wie viele Kandidaten-Canopies gebildet werden, bevor das regelmäßige und das endgültige Bereinigen durchgeführt werden. Dies kann zu einem übermäßigen Speicherverbrauch führen. Diese Einstellung verhindert, dass eine große Anzahl von Kandidaten-Canopies Speicherplatz belegt. |
periodicPruning | Ganzzahl, Standard: 10.000 | Wie oft sollten dünne Baumkronen bei Verwendung von Canopy-Clustering beschnitten werden? |
minDensity | Ganzzahl, Standard: 2 | Die Mindestdichte des Baldachs, unter der ein Baldach beim regelmäßigen Bereinigen entfernt wird, wenn das Baldach-Clustering verwendet wird. |
t1 | Gleitkommazahl, Standardwert: -1,5 | Der T1-Abstand, der beim Canopy-Clustering verwendet werden soll. Ein Wert < 0 wird als positiver Multiplikator für T2 verwendet. |
t2 | Gleitkommazahl, Standardwert: -1 | Der T2-Abstand, der beim Canopy-Clustering verwendet werden soll. Bei Werten < 0 wird eine Heuristik basierend auf der Standardabweichung des Attributs verwendet. |
distanceFunction | String, Standard: „Euclidean“ | Zu verwendende Distanzfunktion. Folgende Optionen sind verfügbar: „Euklidisch“ und „Manhattan“. |
maxIterations | Ganzzahl, Standard: null | Maximale Anzahl an Iterationen. |
preserveOrder | Boolescher Wert, Standard: „false“ | Reihenfolge der Instanzen beibehalten. |
fast | Boolescher Wert, Standard: „false“ | Ermöglicht schnellere Distanzberechnungen mithilfe von Grenzwerten. Deaktiviert die Berechnung/Ausgabe von quadratischen Fehlern/Distanzen. |
seed | Ganzzahl, Standard: 10 | Der Randomisierungs-Seed. |
Sofern nicht anders angegeben, sind die Inhalte dieser Seite unter der Creative Commons Attribution 4.0 License und Codebeispiele unter der Apache 2.0 License lizenziert. Weitere Informationen finden Sie in den Websiterichtlinien von Google Developers. Java ist eine eingetragene Marke von Oracle und/oder seinen Partnern.
Zuletzt aktualisiert: 2025-07-26 (UTC).
[null,null,["Zuletzt aktualisiert: 2025-07-26 (UTC)."],[],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"]]