Questo documento descrive i prerequisiti, le best practice e gli errori comuni quando si utilizzano i set di dati.
Prerequisiti
Quando crei un set di dati:
- I nomi visualizzati devono essere univoci all'interno del progetto Google Cloud.
- I nomi visualizzati devono essere inferiori a 64 byte (poiché questi caratteri sono rappresentati in UTF-8, in alcune lingue ogni carattere può essere rappresentato da più byte).
- Le descrizioni devono avere una dimensione inferiore a 1000 byte.
Quando carichi i dati:
- I tipi di file supportati sono CSV, GeoJSON e KML.
- La dimensione massima supportata per i file è 500 MB.
- I nomi delle colonne degli attributi non possono iniziare con la stringa "?_".
- Le geometrie tridimensionali non sono supportate. Sono inclusi il suffisso "Z" in formato WKT e le coordinate di altitudine in formato GeoJSON.
Best practice per la preparazione dei dati
Se i dati di origine sono complessi o di grandi dimensioni, ad esempio punti densi, lunghe stringhe di linee o poligoni (spesso le dimensioni dei file di origine superiori a 50 MB rientrano in questa categoria), ti consigliamo di semplificare i dati prima di caricarli per ottenere le migliori prestazioni in una mappa visiva.
Di seguito sono riportate alcune best practice per la preparazione dei dati:
- Riduci al minimo le proprietà degli elementi. Mantieni solo le proprietà delle funzionalità necessarie per stilizzare la mappa, ad esempio "id" e "category". Puoi unire proprietà aggiuntive a una funzionalità in un'applicazione client utilizzando gli stili basati sui dati in una chiave di identificatore univoco. Ad esempio, consulta Visualizzare i dati in tempo reale con gli stili basati sui dati.
- Se possibile, utilizza tipi di dati semplici per gli oggetti della proprietà, ad esempio numeri interi, per ridurre al minimo le dimensioni dei riquadri e migliorare le prestazioni della mappa.
- Semplifica le geometrie complesse prima di caricare un file. Puoi farlo in uno strumento geospaziale a tua scelta, ad esempio l'utilità open source Mapshaper.org, oppure in BigQuery utilizzando ST_Simplify su geometrie di poligoni complesse.
- Raggruppa i punti molto fitti prima di caricare un file. Puoi farlo in uno strumento geospaziale di tua scelta, ad esempio le funzioni di clustering di turf.js open source, o in BigQuery utilizzando ST_CLUSTERDBSCAN su geometrie di punti dense.
Consulta ulteriori indicazioni sulle best practice per i set di dati in Visualizzare i dati con i set di dati e BigQuery.
Requisiti GeoJSON
L'API Dataset di Maps supporta la specifica GeoJSON corrente. L'API Maps Datasets supporta anche i file GeoJSON che contengono uno dei seguenti tipi di oggetti:
- Oggetti geometrici. Un oggetto della geometria è una forma spaziale, descritta come unione di punti, linee e poligoni con eventuali fori.
- Caratterizza gli oggetti. Un oggetto elemento contiene una geometria e altre coppie di nome/valore, il cui significato è specifico dell'applicazione.
- Raccolte di funzionalità. Una raccolta di elementi è un insieme di oggetti elemento.
L'API Maps Datasets non supporta i file GeoJSON contenenti dati in un sistema di riferimento di coordinate (CRS) diverso da WGS84.
Per ulteriori informazioni su GeoJSON, consulta RFC 7946.
Requisiti KML
L'API Maps Datasets ha i seguenti requisiti:
- Tutti gli URL devono essere locali (o relativi) al file stesso.
- Sono supportate le geometrie di punti, linee e poligoni.
- Tutti gli attributi dei dati sono considerati stringhe.
- Icone o
<styleUrl>
definiti al di fuori del file. - Link di rete, ad esempio
<NetworkLink>
- Overlay del suolo, ad esempio
<GroundOverlay>
- Geometrie 3D o tag relativi all'altitudine, come
<altitudeMode>
- Specifiche della fotocamera come
<LookAt>
- Stili definiti all'interno del file KML.
Requisiti CSV
Per i file CSV, i nomi delle colonne supportati sono elencati di seguito in ordine di priorità:
latitude
,longitude
lat
,long
x
,y
wkt
(Testo noto)address
,city
,state
ezip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
Ad esempio, il file contiene colonne denominate x
, y
e wkt
.
Poiché x
e y
hanno una priorità più alta, come stabilito dall'ordine dei nomi delle colonne supportate nell'elenco riportato sopra, vengono utilizzati i valori delle colonne x
e y
e la colonna wkt
viene ignorata.
Inoltre:
- Ogni nome di colonna deve appartenere a una singola colonna. In altre parole, non puoi avere una colonna denominata
xy
che contiene dati delle coordinate x e y. Le coordinate x e y devono essere in colonne separate. - I nomi delle colonne non fanno distinzione tra maiuscole e minuscole.
- L'ordine dei nomi delle colonne non è importante. Ad esempio, se il file CSV contiene
colonne
lat
elong
, queste possono comparire in qualsiasi ordine.
Gestire gli errori di caricamento dei dati
Quando carichi i dati in un set di dati, potresti riscontrare uno degli errori comuni descritti in questa sezione.
Errori GeoJSON
Gli errori più comuni di GeoJSON includono:
- Manca il campo
type
otype
non è una stringa. Il file di dati GeoJSON caricato deve contenere un campo stringa denominatotype
all'interno di ogni definizione di oggetto Feature e Geometry.
Errori KML
Gli errori KML più comuni includono:
- Il file di dati non deve contenere nessuna delle funzionalità KML non supportate elencate sopra, altrimenti l'importazione dei dati potrebbe non riuscire.
Errori CSV
Gli errori CSV più comuni includono:
- In alcune righe mancano i valori per una colonna di geometria. Tutte le righe di un file CSV devono contenere valori non vuoti per le colonne di geometria. Le colonne di geometria includono:
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
ezip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
- Se
x
ey
sono le colonne di geometria, assicurati che le unità siano longitudine e latitudine. Alcuni set di dati pubblici utilizzano sistemi di coordinate diversi nelle intestazionix
ey
. Se vengono utilizzate unità errate, il set di dati potrebbe essere importato correttamente, ma i dati visualizzati possono mostrare i punti del set di dati in posizioni impreviste.