Tipos de dados e tipos semânticos

Quando você cria um conector da comunidade, cada campo definido no esquema requer um tipo de dados. O tipo dos dados define o tipo primitivo do campo, como BOOLEAN, STRING, NUMBER etc.

Além dos tipos de dados, o Looker Studio também usa os tipos semânticos. Os tipos semânticos ajudam a descrever o tipo de informação que os dados representam. Por exemplo, um campo com um tipo de dados NUMBER pode representar semanticamente um valor monetário ou uma porcentagem, enquanto um campo com tipo de dados STRING pode representar de forma semântica uma cidade. Para ver os tipos semânticos disponíveis, consulte a documentação sobre tipos semânticos.

Esquema do conector da comunidade e campos do Looker Studio

Ao definir o esquema do seu conector da comunidade, há vários propriedades de cada campo que determinarão como ele será representado e usados no Looker Studio. Exemplo:

  • O conceptType é definido no esquema do conector usando a propriedade conceptType. Isso determina se o campo será tratado como uma dimensão ou métrica. Confira uma explicação sobre a diferença entre métricas e dimensões em Dimensões e métricas.
  • O tipo semântico pode pode ser definido no esquema do conector ou pode ser detectado automaticamente pelo Looker Studio com base a propriedade tipo de dados definida no seu conector e os valores de dados retornados por ele. Consulte Detecção automática do tipo semântico para detalhes sobre como isso funciona.
  • O tipo de agregação determina se os valores das métricas (dimensões) são ignoradas) podem ser agregadas novamente. Como definir o semantics.isReaggregatable como true, o padrão será a agregação SUM. Caso contrário, será Defina como Auto. Você também pode escolher o tipo de agregação padrão para os campos reagregáveis usando a propriedade defaultAggregationType.

Quando você configura e se conecta usando um conector no Looker Studio, os campos O editor mostra o esquema completo do conector com base em como você definiu as propriedades acima. Se você incluiu os tipos semânticos, eles serão exibidos da maneira como você os definiu. Se você estiver usando detecção automática do tipo semântico, os campos serão exibidos conforme forem detectados. Fields Screen

Configurar informações semânticas

Há duas maneiras de definir informações semânticas. É possível definir campos semântica manualmente ou use o Looker Studio para detecção automática.

Por exemplo, se você tem um número que representa semanticamente dólares americanos, O Looker Studio não vai detectar automaticamente esse tipo semântico. Além disso, a detecção automática da semântica exige que o Looker Studio produza dados e buscar chamadas para cada campo do esquema. Se você especificar o esquema manualmente, nenhuma chamada de busca de dados será feita. Caso você saiba o tipo semântico (por exemplo, moeda, porcentagem, data etc.) das suas informações, recomendamos que o configure no esquema para melhorar a precisão e o desempenho.

Definir tipos semânticos manualmente (recomendado)

Se você souber seus tipos semânticos, poderá definir semantics manualmente para cada campo do esquema. Veja todos os detalhes sobre as propriedades disponíveis para você na página de referência do campo. Se optar por especificar manualmente os tipos semânticos, é recomendável que você defina semanticType e semanticGroup para todos os campos. Quando você fornece as propriedades, o processo de detecção automática do tipo semântico não é executado. Se você definir manualmente alguns dos seus campos, mas não todos, aqueles que você não especificar serão definidos por padrão como Text, Number ou Boolean, dependendo do dataType escolhido para o campo.

Confira a seguir um exemplo de esquema simples que define manualmente tipos Income é definido como a moeda, e Filing Year como a data.

data-studio/semantics.gs
var schema = [
  {
    'name': 'Income',
    'label': 'Income (in USD)',
    'dataType': 'NUMBER',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'CURRENCY',
      'semanticType': 'CURRENCY_USD'
    }
  }, {
    'name': 'Filing Year',
    'label': 'Year in which you filed the taxes.',
    'dataType': 'STRING',
    'semantics': {
      'conceptType': 'METRIC',
      'semanticGroup': 'DATE_OR_TIME',
      'semanticType': 'YEAR'
    }
  }
];

Resolver problemas relacionados aos tipos semânticos manuais

Se você definir seus tipos semânticos para os dados subjacentes de maneira incorreta, eles não funcionarão adequadamente. Isso é difícil de testar, mas há algumas estratégias para ajudar a encontrar problemas.

  1. Retornar duas ou três linhas dos seus dados em vez de tudo e manualmente inspecioná-lo.
  2. Crie uma tabela no Looker Studio que use apenas o campo que você está tentando verificação.
  3. Preste muita atenção aos campos Geo e Date, porque eles têm o formato mais rigoroso.

Detecção automática do tipo semântico

Se você não definiu nenhum tipo semântico no esquema, o Looker Studio tentará detectá-los automaticamente com base na a propriedade data type e o formato dos valores de dados retornados pelo seu conector.

Estas são as etapas do processo de detecção automática:

  1. Solicite o esquema executando a função getSchema do seu conector da comunidade.
  2. Itere usando lotes de campos definidos no esquema do conector e envie solicitações getData para os campos. As solicitações getData são executadas com o parâmetro sampleExtraction. definido como true para indicar que as solicitações de dados são para fins de semântica detecção de ameaças.
  3. Com base no tipo de dados de campo e no formato do valor retornado da solicitação getData, identifique o tipo semântico do campo.
.

Opções de detecção automática do tipo semântico

Quando o Looker Studio executa a função getData de um conector da comunidade para para fins de detecção semântica, a solicitação recebida conterá uma sampleExtraction, que será definida como true. Os dados retornados por Seu conector só é usado pelo Looker Studio para identificar o tipo semântico de campo. Como o valor não será usado para nenhum outro propósito, não são necessários dados reais da sua fonte externa.

Há várias maneiras de melhorar a detecção do tipo semântico no seu código:

  • Recomendado: transmita valores predefinidos
    Retornar um valor predefinido para cada campo que melhor representa a semântica para o campo e é conhecido por ser devidamente detectado pelo Looker Studio. Por exemplo: se o tipo semântico de um campo for País, um valor como IT será retornado para "Itália". Outra vantagem dessa abordagem é que ela é muito mais rápida, já que não é necessário fazer solicitações HTTP ao serviço de terceiros para receber dados.

  • Retornar apenas n registros
    Se o serviço de terceiros do qual você está buscando dados for compatível com os limites de linha ao solicitar dados, retornam um pequeno subconjunto de linhas para o Looker Studio. do conjunto de dados completo. Isso vai limitar a quantidade de dados que você precisa transmitir Looker Studio para cada solicitação de detecção semântica.

  • Solicitar todas as colunas e armazenar a resposta em cache
    Se for possível solicitar todas as colunas para o serviço de terceiros da em que você vai buscar dados, depois na primeira solicitação de detecção semântica recebidas do Looker Studio busquem todas as colunas e armazenem os resultados em cache. Para as solicitações de detecção semântica subsequentes, busque valores de coluna do cache em vez de fazer outras solicitações HTTP para o serviço de terceiros.

  • Não faça nada diferente
    Você pode optar por não implementar nenhuma acomodação específica para solicitações em que sampleExtraction é definido como true. Isso fará com que a detecção semântica o processo ficar mais lento, já que o Looker Studio terá que buscar todos os dados para o Processo de detecção semântica. Além disso, a taxa de solicitação da sua fonte de dados externa será afetada, já que muitos pedidos de detecção semântica serão executadas em paralelo.

Formatos reconhecidos para detecção automática do tipo semântico

Data e hora
  • YYYY/MM/DD-HH:MM:SS
  • YYYY-MM-DD [HH:MM:SS[.uuuuuu]]
  • YYYY/MM/DD [HH:MM:SS[.uuuuuu]]
  • YYYYMMDD [HH:MM:SS[.uuuuuu]]
  • Sat, 24 May 2008 20:09:47 GMT
  • 2008-05-24T20:09:47Z
  • Hora: época por segundos, microssegundos, milissegundos e nanossegundos.
Informações geográficas