Questo documento descrive i prerequisiti, le best practice e gli errori comuni quando si utilizzano i set di dati.
Prerequisiti
Quando crei un set di dati:
- I nomi visualizzati devono essere univoci all'interno del progetto Google Cloud.
- I nomi visualizzati devono avere meno di 64 byte (poiché questi caratteri sono rappresentati in UTF-8, in alcune lingue ogni carattere può essere rappresentato da più byte).
- Le descrizioni devono avere una dimensione inferiore a 1000 byte.
Quando carichi i dati:
- I tipi di file supportati sono CSV, GeoJSON e KML.
- La dimensione massima supportata per i file è 500 MB.
- I nomi delle colonne degli attributi non possono iniziare con la stringa "?_".
- Le geometrie tridimensionali non sono supportate. Sono inclusi il suffisso "Z" nel formato WKT e la coordinata altitudine nel formato GeoJSON.
Best practice per la preparazione dei dati
Se i dati di origine sono complessi o di grandi dimensioni, ad esempio punti densi, linee o poligoni lunghi (spesso i file di origine di dimensioni superiori a 50 MB rientrano in questa categoria), ti consigliamo di semplificare i dati prima del caricamento per ottenere il rendimento migliore in una mappa visiva.
Di seguito sono riportate alcune best practice per la preparazione dei dati:
- Riduci al minimo le proprietà degli elementi. Mantieni solo le proprietà delle funzionalità necessarie per stilizzare la mappa, ad esempio "id" e "category". Puoi unire proprietà aggiuntive a una funzionalità in un'applicazione client utilizzando stili basati sui dati su una chiave di identificatore univoco. Ad esempio, consulta Visualizzare i dati in tempo reale con gli stili basati sui dati.
- Utilizza tipi di dati semplici per gli oggetti proprietà, se possibile, come gli interi, per ridurre al minimo le dimensioni dei riquadri e migliorare il rendimento della mappa.
- Semplifica le geometrie complesse prima di caricare un file. Puoi farlo in uno strumento geospaziale di tua scelta, ad esempio l'utilità open source Mapshaper.org, o in BigQuery utilizzando ST_Simplify su geometrie di poligoni complesse.
- Raggruppa i punti molto fitti prima di caricare un file. Puoi farlo in uno strumento geospaziale di tua scelta, ad esempio le funzioni di clustering di turf.js open source, o in BigQuery utilizzando ST_CLUSTERDBSCAN su geometrie di punti dense.
Consulta ulteriori indicazioni sulle best practice per i set di dati in Visualizzare i dati con i set di dati e BigQuery.
Requisiti GeoJSON
L'API Dataset di Maps supporta la specifica GeoJSON corrente. L'API Maps Datasets supporta anche i file GeoJSON che contengono uno dei seguenti tipi di oggetti:
- Oggetti geometrici. Un oggetto della geometria è una forma spaziale, descritta come unione di punti, linee e poligoni con eventuali fori.
- Oggetti Feature. Un oggetto elemento contiene una geometria e altre coppie nome/valore, il cui significato è specifico dell'applicazione.
- Raccolte di funzionalità. Una raccolta di elementi è un insieme di oggetti elemento.
L'API Dataset di Maps non supporta i file GeoJSON con dati in un sistema di riferimento di coordinate (CRS) diverso da WGS84.
Per ulteriori informazioni su GeoJSON, consulta RFC 7946.
Requisiti KML
L'API Maps Datasets ha i seguenti requisiti:
- Tutti gli URL devono essere locali (o relativi) al file stesso.
- Sono supportate le geometrie di punti, linee e poligoni.
- Tutti gli attributi dei dati sono considerati stringhe.
- Icone o
<styleUrl>
definiti al di fuori del file. - Link di rete, ad esempio
<NetworkLink>
- Overlay del suolo, ad esempio
<GroundOverlay>
- Geometrie 3D o tag relativi all'altitudine, come
<altitudeMode>
- Specifiche della fotocamera, ad esempio
<LookAt>
- Stili definiti all'interno del file KML.
Requisiti CSV
Per i file CSV, i nomi delle colonne supportati sono elencati di seguito in ordine di priorità:
latitude
,longitude
lat
,long
x
,y
wkt
(Well-Known Text)address
,city
,state
ezip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
Ad esempio, il file contiene colonne denominate x
, y
e wkt
.
Poiché x
e y
hanno una priorità più alta, come stabilito dall'ordine dei nomi delle colonne supportate nell'elenco riportato sopra, vengono utilizzati i valori delle colonne x
e y
e la colonna wkt
viene ignorata.
Inoltre:
- Ogni nome di colonna deve appartenere a una singola colonna. In altre parole, non puoi avere una colonna denominata
xy
che contenga sia i dati delle coordinate x che quelli delle coordinate y. Le coordinate x e y devono essere in colonne separate. - I nomi delle colonne non fanno distinzione tra maiuscole e minuscole.
- L'ordine dei nomi delle colonne non è importante. Ad esempio, se il file CSV contiene
colonne
lat
elong
, possono verificarsi in qualsiasi ordine.
Gestire gli errori di caricamento dei dati
Quando carichi i dati in un set di dati, potresti riscontrare uno degli errori comuni descritti in questa sezione.
Errori GeoJSON
Gli errori GeoJSON più comuni includono:
- Manca il campo
type
otype
non è una stringa. Il file di dati GeoJSON caricato deve contenere un campo stringa denominatotype
all'interno di ogni definizione di oggetto Feature e Geometry.
Errori KML
Gli errori KML più comuni includono:
- Il file di dati non deve contenere nessuna delle funzionalità KML non supportate elencate sopra, altrimenti l'importazione dei dati potrebbe non riuscire.
Errori CSV
Gli errori CSV più comuni includono:
- In alcune righe mancano i valori per una colonna di geometria. Tutte le righe di un file CSV devono contenere valori non vuoti per le colonne di geometria. Le colonne di geometria includono:
latitude
,longitude
lat
,long
x
,y
wkt
address
,city
,state
ezip
address
- Una singola colonna contenente tutte le informazioni sull'indirizzo, ad esempio
1600 Amphitheatre Parkway Mountain View, CA 94043
- Se
x
ey
sono le colonne di geometria, assicurati che le unità siano latitudine e longitudine. Alcuni set di dati pubblici utilizzano sistemi di coordinate diversi nelle intestazionix
ey
. Se vengono utilizzate unità errate, il set di dati potrebbe essere importato correttamente, ma i dati visualizzati possono mostrare i punti del set di dati in posizioni impreviste.