Types de données et types sémantiques

Lorsque vous créez un connecteur de communauté, chaque champ que vous définissez dans le schéma nécessite un type de données. Le type de données définit le type primitif du champ : BOOLEAN, STRING, NUMBER, etc.

En plus des types de données, Looker Studio utilise également des types sémantiques. Les types sémantiques aident à décrire le type d'informations que les données représentent. Pour Par exemple, un champ avec le type de données NUMBER peut représenter sémantiquement une devise. quantité ou pourcentage et un champ avec un type de données STRING peuvent, sur le plan sémantique, représentent une ville. Pour connaître les types sémantiques disponibles, consultez la documentation sur les types sémantiques

Schéma du connecteur de communauté et champs Looker Studio

Lorsque vous définissez le schéma de votre connecteur de communauté, plusieurs éléments des propriétés de chaque champ qui détermineront comment le champ est représenté et utilisées dans Looker Studio. Exemple :

  • Le conceptType est défini dans votre schéma de connecteur à l'aide de la propriété conceptType. Ce détermine si le champ est traité en tant que dimension ou métrique. Pour en savoir plus sur la différence entre les métriques et les dimensions, cliquez ici. à Dimensions et métriques :
  • Le type sémantique peut définies dans le schéma du connecteur ou peuvent être détectées automatiquement par Looker Studio en fonction Propriété de type de données définie dans le connecteur et les valeurs de données qu'il renvoie. Voir Pour en savoir plus sur la détection automatique de type sémantique, consultez cette page. comment cela fonctionne.
  • Le type d'agrégation détermine si les valeurs des métriques (dimensions sont ignorées) peuvent être réagrégées. Définir semantics.isReaggregatable sur true utilise l'agrégation SUM par défaut. Sinon, elle est définie sur Auto. Vous pouvez également définir manuellement un type d'agrégation par défaut pour les champs réagrégables à l'aide de la méthode defaultAggregationType .

Lorsque vous configurez un connecteur et que vous vous y connectez dans Looker Studio, les champs affiche le schéma complet du connecteur, en fonction de la manière dont vous avez défini les propriétés ci-dessus. Si vous avez inclus les types sémantiques, comme vous les avez définis. Si vous utilisez détection automatique du type sémantique, les champs s'afficheront tels qu'ils ont été détectés. Écran Champs

Définir des informations sémantiques

Il existe deux façons de définir des informations sémantiques. Vous pouvez définir un champ ou utiliser Looker Studio pour la détection automatique.

Par exemple, si vous avez un nombre qui représente sémantiquement le dollar américain, Looker Studio ne sera pas en mesure de détecter automatiquement ce type sémantique. De plus, la détection sémantique automatique nécessite que Looker Studio rende les données récupérer des appels pour chaque champ de votre schéma. Si vous spécifiez manuellement le schéma au lieu de cela, aucun appel de récupération de données ne sera effectué. Si vous connaissez le (devise, pourcentage, date, etc.) pour vos données, nous nous vous recommandons de le définir explicitement dans le schéma pour plus de précision et de performances raisons.

Définir manuellement des types sémantiques (recommandé)

Si vous connaissez vos types sémantiques, vous pouvez définir manuellement semantics pour chaque schema. Pour en savoir plus sur les propriétés disponibles, consultez sur la page de référence des champs. Si vous des types sémantiques manuels, nous vous recommandons de définir semanticType et semanticGroup pour chaque champ. En fournissant manuellement le processus de détection automatique du type sémantique ne s'exécutera pas. Si vous vous pouvez définir manuellement certains de vos champs, mais pas tous, spécifiez la valeur par défaut Text, Number ou Boolean en fonction de la dataType spécifié pour le champ.

Voici un exemple de schéma simple qui définit manuellement de données. Income est défini en tant que devise, et Filing Year en tant que date.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Résoudre les problèmes liés aux types sémantiques manuels

Si vous définissez des types sémantiques de manière incorrecte pour les données sous-jacentes, ils ne fonctionnent pas correctement. Cela peut être difficile à tester, mais il y a certaines choses que vous pouvez faire pour vous aider à détecter les problèmes.

  1. Renvoyez deux ou trois lignes de vos données au lieu de l'ensemble, puis renvoyez manuellement l'inspecter.
  2. Créer une table dans Looker Studio qui n'utilise que le champ que vous essayez d'utiliser vérifier.
  3. Portez une attention particulière aux champs Geo et Date, car ils ont le plus rigoureux.

Détection automatique du type sémantique

Si vous n'avez défini aucun type sémantique dans votre schéma, Looker Studio tente de les détecter automatiquement data type et le format des valeurs de données renvoyées par votre connecteur.

Les étapes du processus de détection automatique sont les suivantes:

  1. Demandez le schéma en exécutant la commande fonction getSchema de votre le connecteur de communauté.
  2. Parcourez des lots de champs définis dans le schéma de connecteur et émettez getData demande les champs. Les requêtes getData sont exécutées avec le paramètre sampleExtraction. défini sur true pour indiquer que les requêtes de données sont à des fins la détection automatique.
  3. Basé sur le type de données du champ et le format de la valeur renvoyée par getData, identifient le type sémantique du champ.

Options de gestion de la détection automatique de type sémantique

Lorsque Looker Studio exécute la fonction getData d'un connecteur de communauté pour dans le but de la détection sémantique, la requête entrante contient sampleExtraction, qui sera définie sur true. Les données renvoyées par votre connecteur n'est utilisé par Looker Studio que pour identifier le type sémantique sur le terrain. Étant donné que la valeur n'est pas utilisée à d'autres fins, elle n'est nécessitent des données réelles de votre source externe.

Il existe plusieurs façons d'améliorer la détection de type sémantique dans votre code:

  • Recommandé: transmettre des valeurs prédéfinies
    Renvoyer une valeur prédéfinie pour chaque champ représentant le mieux la sémantique du champ. Il est reconnu pour être détecté correctement par Looker Studio. Par exemple, si le type sémantique d'un champ est Country, la valeur comme IT pour l'Italie. L'autre avantage de cette approche est qu'elle est beaucoup plus rapide, car vous n'avez pas à envoyer de requêtes HTTP au un service tiers pour les données.

  • Ne renvoie que n enregistrements
    Si le service tiers à partir duquel vous récupérez les données accepte la limite de lignes lorsque vous demandez des données, renvoyez plutôt un petit sous-ensemble de lignes à Looker Studio de l'ensemble de données complet. Cela limitera la quantité de données que vous devez transmettre à Looker Studio pour chaque requête de détection sémantique.

  • Demander toutes les colonnes et mettre en cache la réponse
    S'il est possible de demander toutes les colonnes du service tiers à que vous récupérez des données, puis lors de la première requête provenant de Looker Studio extraient toutes les colonnes et mettent les résultats en cache. Pour Les requêtes de détection sémantique ultérieures extraient les valeurs de colonne du cache au lieu d'envoyer des requêtes HTTP supplémentaires au service tiers.

  • Ne faites rien de différent
    Vous pouvez choisir de ne pas appliquer d'aménagement spécifique pour les demandes sampleExtraction est défini sur true. Le service de détection sémantique car Looker Studio devra récupérer toutes les données Processus de détection sémantique. De plus, cela affectera le taux de demandes votre source de données externe, car de nombreuses requêtes de détection sémantique exécutés en parallèle.

Formats reconnus pour la détection automatique des types sémantiques

Date et heure
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Time: epoch pour "second", "micro", "milli" et "nano".
Données géographiques