Avant de commencer

Ce document décrit les conditions préalables, les bonnes pratiques et les erreurs courantes. lorsque vous travaillez avec des jeux de données.

Prérequis

Lorsque vous créez un ensemble de données :

  • Les noms à afficher doivent être uniques au sein de votre projet Google Cloud.
  • Les noms à afficher doivent comprendre moins de 64 octets (ces caractères étant représentés au format UTF-8, chaque caractère peut correspondre à plusieurs octets dans certaines langues).
  • Les descriptions doivent comprendre moins de 1 000 octets.

Lorsque vous importez des données :

  • Les types de fichiers CSV, GeoJSON et KML sont acceptés.
  • La taille maximale autorisée pour les fichiers est de 500 Mo.
  • Les noms de colonnes d'attributs ne peuvent pas commencer par la chaîne "?_".
  • Les géométries tridimensionnelles ne sont pas acceptées. Cela inclut le suffixe "Z" au format WKT et les coordonnées d'altitude au format GeoJSON.

Bonnes pratiques pour la préparation des données

Si vos données sources sont complexes ou volumineuses, par exemple des points denses, des longues polylignes ou des polygones (souvent, les fichiers sources de taille supérieure à 50 Mo entrent dans cette catégorie), envisagez de simplifier vos données avant de l'importer pour obtenir les meilleures performances dans une carte visuelle.

Voici quelques bonnes pratiques pour préparer vos données:

  1. Réduire les propriétés de l'élément géographique. Conserver uniquement les propriétés des éléments géographiques nécessaires pour appliquer un style sur votre carte (par exemple, "id") ; et "category". Vous pouvez joindre d'autres propriétés à un élément géographique dans un client. application utilisant des styles basés sur les données sur une clé d'identifiant unique. Par exemple, consultez Consultez vos données en temps réel grâce au style basé sur les données.
  2. Dans la mesure du possible, utilisez des types de données simples pour les objets de propriété, tels que des entiers, pour réduire la taille des tuiles et améliorer les performances de la carte.
  3. Simplifier les géométries complexes avant d'importer un fichier. Pour ce faire, l'outil géospatial de votre choix, tel que l'Open Source Mapshaper.org, ou dans BigQuery à l'aide de ST_Simplify sur des géométries de polygones complexes.
  4. Regroupez les points très denses avant d'importer un fichier. Pour ce faire, l'outil géospatial de votre choix, tel que l'Open Source Fonctions de cluster turf.js, ou dans BigQuery avec ST_CLUSTERDBSCAN sur des géométries de points denses.

Pour obtenir des conseils supplémentaires sur les bonnes pratiques concernant les ensembles de données, consultez la section Visualisez vos données à l'aide d'ensembles de données et de BigQuery.

Exigences GeoJSON

L'API Maps Datasets est compatible avec la version actuelle Spécification GeoJSON : L'API Maps Datasets est également compatible avec les fichiers GeoJSON contenant l'un des types d'objets suivants:

  • Objets Geometry : un objet Geometry est une forme spatiale, décrite comme une union de points, de lignes et de polygones avec facultativement des trous.
  • Objets Feature : un objet Feature contient une géométrie et des paires nom/valeur supplémentaires, dont la signification dépend de l'application.
  • Collections d'éléments géographiques : une collection d'éléments géographiques est un ensemble d'objets Feature.

L'API Maps Datasets n'est pas compatible avec les fichiers GeoJSON contenant des données dans un système de coordonnées de référence. (CRS) autre que WGS84.

Pour en savoir plus sur GeoJSON, consultez la page sur la conformité RFC 7946.

Exigences KML

La configuration requise pour l'API Maps Datasets est la suivante:

  • Toutes les URL doivent être locales (ou relatives) par rapport au fichier lui-même.
  • Les géométries acceptées sont les points, les lignes et les polygones.
  • Tous les attributs de données sont considérés comme des chaînes.
Les éléments géographiques KML suivants ne sont pas acceptés :
  • Icônes ou <styleUrl> définis en dehors du fichier
  • Liens réseau tels que <NetworkLink>
  • Superpositions au sol telles que <GroundOverlay>
  • Géométries 3D ou toute balise d'altitude telle que <altitudeMode>
  • Spécifications concernant la prise de vue telles que <LookAt>
  • Styles définis dans le fichier KML

Exigences du format CSV

Pour les fichiers CSV, les noms de colonnes acceptés sont indiqués ci-dessous par ordre de priorité :

  • latitude, longitude
  • lat, long
  • x, y
  • wkt (Well-Known Text)
  • address, city, state et zip
  • address
  • Une seule colonne contenant toutes les informations d'adresse telles que 1600 Amphitheatre Parkway Mountain View, CA 94043

Par exemple, votre fichier contient des colonnes nommées x, y et wkt. Étant donné que x et y ont une priorité plus élevée d'après l'ordre des noms de colonnes acceptés dans la liste ci-dessus, les valeurs des colonnes x et y sont utilisées, et la colonne wkt est ignorée.

En outre :

  • Chaque nom de colonne doit appartenir à une seule colonne. Autrement dit, vous ne pouvez pas avoir de colonne nommée xy contenant à la fois les coordonnées x et y. Les coordonnées x et y doivent se trouver dans des colonnes distinctes.
  • Les noms de colonnes ne sont pas sensibles à la casse.
  • L'ordre des noms de colonnes n'a pas d'importance. Par exemple, si votre fichier CSV contient les colonnes lat et long, elles peuvent apparaître dans n'importe quel ordre.

Gérer les erreurs d'importation de données

Lorsque vous importez des données dans un ensemble de données, vous pouvez rencontrer l'une des erreurs courantes décrites dans cette section.

Erreurs GeoJSON

Voici quelques erreurs GeoJSON courantes :

  • Champ type manquant, ou bien le type n'est pas une chaîne. Le fichier de données GeoJSON importé doit contenir un champ de type chaîne nommé type dans chaque définition d'objet Feature et Geometry.

Erreurs KML

Voici quelques erreurs KML courantes :

  • Le fichier de données ne doit contenir aucun des éléments géographiques KML non acceptés dont la liste figure plus haut dans ce document. Sinon, l'importation des données risque d'échouer.

Erreurs CSV

Voici quelques erreurs CSV courantes :

  • Certaines lignes ne contiennent aucune valeur dans une colonne de géométrie. Toutes les lignes d'un fichier CSV doivent contenir des valeurs non vides pour les colonnes de géométrie. Les colonnes de géométrie incluent :
    • latitude, longitude
    • lat, long
    • x, y
    • wkt
    • address, city, state et zip
    • address
    • Une seule colonne contenant toutes les informations d'adresse telles que 1600 Amphitheatre Parkway Mountain View, CA 94043
  • Si x et y sont des colonnes de géométrie, assurez-vous que les unités sont la longitude et la latitude. Certains ensembles de données publics utilisent différents systèmes de coordonnées sous les en-têtes x et y. Si vous utilisez des unités incorrectes, l'ensemble de données sera peut-être importé, mais dans le rendu, les points de l'ensemble de données pourront s'afficher à des emplacements inattendus.