הודעה: כל הפרויקטים הלא מסחריים שנרשמו לשימוש ב-Earth Engine לפני
15 באפריל 2025 חייבים
לאמת את הזכאות לשימוש לא מסחרי כדי לשמור על הגישה. אם לא תאמתו את החשבון עד 26 בספטמבר 2025, יכול להיות שהגישה שלכם תושעה.
ee.Clusterer.wekaKMeans
קל לארגן דפים בעזרת אוספים
אפשר לשמור ולסווג תוכן על סמך ההעדפות שלך.
ביצוע אשכול נתונים באמצעות אלגוריתם k-means. אפשר להשתמש במרחק האוקלידי (ברירת מחדל) או במרחק מנהטן. אם משתמשים במרחק מנהטן, מרכזי המסה מחושבים כממוצע החציונים של הרכיבים ולא כממוצע. למידע נוסף:
ד. ארתור, ס. Vassilvitskii: k-means++: the advantages of careful seeding. In: Proceedings of the eighteenth annual ACM-SIAM symposium on Discrete algorithms, 1027-1035, 2007.
| שימוש | החזרות |
|---|
ee.Clusterer.wekaKMeans(nClusters, init, canopies, maxCandidates, periodicPruning, minDensity, t1, t2, distanceFunction, maxIterations, preserveOrder, fast, seed) | Clusterer |
| ארגומנט | סוג | פרטים |
|---|
nClusters | מספר שלם | מספר הצבירים. |
init | מספר שלם, ברירת מחדל: 0 | שיטת האתחול שבה רוצים להשתמש. 0 = אקראי, 1 = k-means++, 2 = canopy, 3 = farthest first. |
canopies | בוליאני, ברירת מחדל: false | אפשר להשתמש בחופות כדי לצמצם את מספר חישובי המרחק. |
maxCandidates | מספר שלם, ברירת מחדל: 100 | המספר המקסימלי של חופות מועמדות שיישארו בזיכרון בכל זמן נתון כשמשתמשים באשכול חופות. המרחק T2 בתוספת מאפייני הנתונים יקבעו כמה חופות מועמדות ייווצרו לפני שיתבצעו גיזום תקופתי וגיזום סופי, מה שעלול לגרום לצריכת זיכרון מוגזמת. ההגדרה הזו מונעת מצבים שבהם מספר גדול של חופות מועמדות צורך זיכרון. |
periodicPruning | מספר שלם, ברירת מחדל: 10,000 | תדירות הגיזום של חופות עם צפיפות נמוכה כשמשתמשים באשכולות חופות. |
minDensity | מספר שלם, ברירת מחדל: 2 | צפיפות מינימלית של חופת העצים, כשמשתמשים באשכולות של חופות עצים, שמתחתיה חופת העצים תיגזם במהלך גיזום תקופתי. |
t1 | מספר ממשי (float), ברירת מחדל: -1.5 | המרחק T1 שמשמש כשמשתמשים בשיטת האשכולות canopy. ערך קטן מ-0 נחשב כמכפיל חיובי ל-T2. |
t2 | מספר ממשי (float), ברירת מחדל: -1 | המרחק T2 שמשמש כשמשתמשים בשיטת האשכולות canopy. ערכים קטנים מ-0 גורמים לשימוש בהיוריסטיקה שמבוססת על סטיית התקן של המאפיין. |
distanceFunction | מחרוזת, ברירת מחדל: Euclidean | פונקציית המרחק שבה רוצים להשתמש. האפשרויות הן: Euclidean ו-Manhattan. |
maxIterations | מספר שלם, ברירת מחדל: null | המספר המקסימלי של איטרציות. |
preserveOrder | בוליאני, ברירת מחדל: false | שמירה על סדר המכונות. |
fast | בוליאני, ברירת מחדל: false | מאפשרת חישובים מהירים יותר של מרחקים, באמצעות ערכי סף. משביתה את החישוב או הפלט של שגיאות או מרחקים בריבוע. |
seed | מספר שלם, ברירת מחדל: 10 | ערך הבסיס לארגון בסדר אקראי. |
אלא אם צוין אחרת, התוכן של דף זה הוא ברישיון Creative Commons Attribution 4.0 ודוגמאות הקוד הן ברישיון Apache 2.0. לפרטים, ניתן לעיין במדיניות האתר Google Developers. Java הוא סימן מסחרי רשום של חברת Oracle ו/או של השותפים העצמאיים שלה.
עדכון אחרון: 2025-07-26 (שעון UTC).
[null,null,["עדכון אחרון: 2025-07-26 (שעון UTC)."],[],["The k-means algorithm clusters data using either Euclidean or Manhattan distance. Manhattan distance uses component-wise median for centroids, while Euclidean uses the mean. Initialization methods include random, k-means++, canopy, and farthest first. Canopies can be used to optimize distance calculations. Parameters control the number of clusters, pruning frequency, density thresholds, and distance settings. Additional options include limiting iterations, preserving data order, and using a fast distance calculation mode.\n"]]