Rechenbenchmarks

Um potenzielle Earth Engine-Rechenkosten zu modellieren, haben wir eine Reihe von Benchmark-Vorgängen ausgeführt und den entsprechenden Rechenbedarf protokolliert. Diese Daten können nützlich sein, um die Rechenkosten für Ihre eigene Verarbeitung anhand ähnlicher Kriterien zu modellieren (siehe Verwendung dieser Daten).

Methodik

Notebooks

Wir verwenden ein Colab-Notebook, um diese Messungen zu generieren, und ein anderes, um die Ergebnisse aus Cloud Monitoring zu analysieren.

Vorgang

Dazu gehören einige gängige Earth Engine-Vorgänge.

  • Bild exportieren ist ein Rasterbildexport mit der Batch-Verarbeitungsfunktion Export.image.toCloudStorage(). Diese Methode wird häufig verwendet, um eine große Anzahl von Pixeln nach Cloud Storage zu exportieren.
  • Mit In BigQuery exportieren werden Punkte aus einem Raster mithilfe der Batchverarbeitungsfunktion Export.table.toBigQuery() in Google BigQuery geschrieben. Wenn Sie Daten in BigQuery schreiben, können sie sowohl in BigQuery analysiert als auch in anderen Tools und Diensten verwendet werden, die in BigQuery eingebunden sind (z. B. Looker Studio).
  • Bei der Extraktion mit hoher Datenmenge werden Bildbereiche mit einer Größe von 256 × 256 Pixeln um eine Reihe von Punkten heruntergeladen. Das ist bei Workflows für maschinelles Lernen üblich, bei denen Training und Inferenz auf kleinen Pixelflecken angewendet werden.

In Bearbeitung

In diesem Feld sehen Sie, welche Pixelverarbeitungspipeline zum Generieren eines bestimmten Ergebnisses verwendet wurde. Bei allen diesen Vorgängen wird grundsätzlich ein Rasterbild verwendet (entweder direkt exportiert, mit Geometrien gemustert oder Patches extrahiert). Die Option „Verarbeitung“ beschreibt den Mechanismus zum Generieren der Pixel in diesem Raster.

Derzeit ist nur die Option „Sentinel-2-Mosaik“ verfügbar. Diese Seite wird jedoch möglicherweise in Zukunft um Benchmarks mit verschiedenen Verarbeitungsoptionen ergänzt. Das Sentinel-2-Mosaik wird mit einem Filter- und Kompositionsalgorithmus auf Grundlage von Sentinel-2-Daten für den relevanten Zeitraum, die Auflösung usw. erstellt. Die spezifischen Parameter und Vorgänge werden im Messnotizbuch beschrieben. Die Sentinel-2-Komposition ist ein sehr häufiger erster Schritt oder Zwischendatenprodukt, die spezifischen Parameter (z. B. der Prozentsatz der Wolkenbedeckung) variieren jedoch.

Region

Hier werden folgende Regionen verwendet:

  • Bay Area: Eine einfache ee.Geometry.Rectangle um die San Francisco Bay Area. Das ist interessant, da es sowohl Land- als auch Ozeanpixel enthält. Daher sind nicht alle Bereiche mit Sentinel-2-Bildern abgedeckt.

    Fläche (ca.) Abmessungen bei 10 m/Pixel Abmessungen bei 30 m/Pixel Abmessungen bei 120 m/Pixel
    22.779 km² [21342,13554]
    2,9 × 108 Pixel
    [7114 × 4518]
    3,2 E7 Pixel
    [1779x1130]
    2010270 Pixel

  • Nigeria: Die Grenzen von Nigeria aus dem vereinfachten LSIB-Datensatz. Dies ist die größte Region und sie ist interessant, weil sie sowohl eine bewölkte Region ist (d. h. es gibt weniger wolkenfreie Pixel) als auch nahe am Äquator liegt (d. h. sie wird relativ seltener von Satelliten mit polarem Orbit wie Sentinel-2 besucht).

    Fläche (ca.) Abmessungen bei 10 m/Pixel Abmessungen bei 30 m/Pixel Abmessungen bei 120 m/Pixel
    912.554 km² [133595 × 107035]
    1,4 E10 Pixel
    [44532x35679]
    1,6 E9 Pixel
    [11133 × 8920]
    9,9 × 107 Pixel

  • Deutschland: Die Grenzen Deutschlands aus dem vereinfachten LISB-Dataset. Sie ist stärker von saisonalen Schwankungen betroffen als die anderen Regionen.

    Fläche (ca.) Abmessungen bei 10 m/Pixel Abmessungen bei 30 m/Pixel Abmessungen bei 120 m/Pixel
    356.077 km² [102130 × 86666]
    8,9 E9 Pixel
    [34044 × 28889]
    9,8 E8 Pixel
    [8511 × 7223]
    6,1 × 107 Pixel

Weitere Informationen zu den Regionen finden Sie in dieser Ansicht der Regionen im Code-Editor.

Skalieren

Alle Pixelberechnungen erfolgen innerhalb eines Rasters, z. B. beim Erstellen eines mosaikartigen Musters. Mit der hier festgelegten Skalierung wird die Größe der Pixel in Metern am Punkt des wahren Maßstabs der Projektion gesteuert.

Je höher der Wert für „Maßstab“ ist, desto niedriger ist die Auflösung. Wenn Sie den Wert für „Maßstab“ also erhöhen, wird die Anzahl der Pixel in einem Bildexport für eine Region reduziert.

Zeitraum

Bei jedem Vorgang wird ein Kompositionierungsschritt auf dem zugrunde liegenden Datensatz ausgeführt. Der hier aufgeführte Zeitraum ist der gesamte Kalenderzeitraum, der beim Filtern des Datensatzes berücksichtigt wird. Je länger der Zeitraum, desto mehr Daten.

Hier sind die Zeiträume von drei, sechs und zwölf Monaten vor dem 01.01.2024 gemeint.

Beispiele

Die Anzahl der Stichproben hat je nach Vorgang eine unterschiedliche Bedeutung.

  • Beim Exportieren tabellarischer Daten nach BigQuery ist dies die Anzahl der zufälligen Punkte, die aus dem Datensatz ausgewählt und exportiert werden. Mit anderen Worten: Dies ist die Anzahl der Zeilen im endgültigen BigQuery-Dataset.

  • Beim Exportieren von TFRecord-Patches über den API-Endpunkt für hohes Volumen ist dies die Gesamtzahl der Regionen mit 256 × 256 Pixeln, die an zufälligen Punkten innerhalb des gewünschten Bereichs abgetastet werden. Hinweis: Patches können sich mit dieser Methodik überschneiden.

  • Bei Bildexporten wird die Anzahl der Samples hier als „–“ angezeigt, da keine Samples im herkömmlichen Sinne verwendet werden (jeder Pixelwert wird berechnet). Sie können sich Bildexporte als Raster von Samples vorstellen, bei dem die Anzahl der Samples der Anzahl der Pixel im Ergebnis entspricht.

Verwendung dieser Daten

Diese Beispielmessungen dienen nur zur Veranschaulichung. Sie sollen reale Beispiele für die Leistung von Earth Engine und die Kosten in EECU-Zeit liefern, sind aber keine Garantie. Weitere Informationen finden Sie im Abschnitt Hinweise.

Wenn Sie mit Ihren eigenen Verarbeitungsworkflows Samples generieren möchten, verwenden Sie die beiden Notebooks im Abschnitt Notebooks. Mit diesen Funktionen können Sie eine Reihe von Messungen für benutzerdefinierten Code generieren und die Ergebnisse aus Cloud Monitoring lesen und zusammenfassen.

Vorsichtsmaßnahmen

Das Caching wirkt sich auf diese Ergebnisse aus. Mit einem zufälligen Startwert (RANDOM_SEED im Notebook für Messungen) können Sie jedoch die im Cache gespeicherten Ergebnisse so weit wie möglich überspringen, sodass die Werte zwischen den einzelnen Läufen konsistenter sind. Diese Methode ist jedoch nicht perfekt, da es einige Caches gibt, die nicht direkt vom Nutzer gesteuert werden können (z.B. Caches für Bildkacheln).

Der Status des Datenkatalogs wirkt sich ebenfalls auf diese Ergebnisse aus, da sich die zugrunde liegenden Sammlungen unter anderem ändern, neu verarbeitet oder mit neuen Daten aufgefüllt werden können.

Außerdem kann die Aktivität aller Nutzer der Earth Engine-Auslieferungsinfrastruktur eine Rolle spielen. Eine systemweite stärkere Nutzung des Caches oder andere Nutzer, die ähnliche Berechnungen ausführen, können sich auf die EECU-Zeit für Ihre Ergebnisse auswirken.

Benchmarkdaten

Dies sind reale Benchmarks (die tatsächlichen Kosten für die Ausführung am 08.03.2024). Sie sind jedoch keine Garantie – die tatsächlichen Rechenkosten können erheblich variieren.

Die Kosten für eine EECU-Stunde der Verarbeitung können je nach Preismodell und Währungsumrechnung in Google Cloud Billing unterschiedlich sein (z. B. in USD oder EUR).

  • Bild exportieren
  • Nach BigQuery exportieren
  • Extraktion mit hohem Volumen
  • Sentinel-2-Komposit
  • Bay Area
  • Deutschland
  • Nigeria
  • 10 Meter
  • 30 Meter
  • 120 Meter
  • 3 Monate
  • 6 Monate
  • 12 Monate
  • 100 Beispiele
  • 500 Beispiele
  • 1.000 Beispiele

Hinweis zu Earth Engine-Benchmarks

Vorgang In Bearbeitung Region Skalieren Zeitraum Beispiele Compute-Benchmark
Bild exportieren Sentinel-2-Komposit Bay Area 10 Meter 12 Monate 105,09 EECU-Stunden
Bild exportieren Sentinel-2-Komposit Bay Area 10 Meter 6 Monate 41,53 EECU-Stunden
Bild exportieren Sentinel-2-Komposit Bay Area 10 Meter 3 Monate 29,95 EECU-Stunden