Monitorar sua infraestrutura

Depois que você fizer upgrade da inclusão de tags no servidor e a configuração estiver pronta para produção, siga algumas etapas para monitorar a implantação.

Embora seja necessário verificar com regularidade o status da implantação, os principais momentos são:

  • Na primeira implementação do ambiente e nos dias/semanas seguintes para garantir que haja computação suficiente disponível para o tráfego recebido.
  • Antes dos picos de tráfego conhecidos, por exemplo, no início de campanhas sazonais ou antes de um lançamento importante.

Três opções de monitoramento úteis no Google Cloud Platform são os relatórios do Cloud Run, de faturamento e o Cloud Logging.

Relatórios do Cloud Run

Ao executar o ambiente de inclusão de tags no servidor no Google Cloud Run, é possível acessar relatórios muito úteis na seção "Cloud Run" do console do Google Cloud Platform.

Quando você clica no serviço Cloud Run, é mostrado um painel com um relatório interessante sobre a integridade geral do servidor de tags.

Captura de tela de um relatório do Cloud Run no Google Cloud Platform
  1. Escolha um intervalo para as estatísticas.
  2. O card Contagem de solicitações mostra o número de solicitações que o serviço recebe. O número é calculado a cada 60 segundos e categorizado em códigos de resposta HTTP diferentes (por exemplo, 2XX, 4XX, 5XX).
  3. O card Contagem de instâncias do contêiner mostra a quantidade de instâncias implantadas em um momento específico. Se o número estiver abaixo do mínimo configurado, a região do Google Cloud selecionada poderá ter problemas de disponibilidade de recursos.
  4. O card Uso da CPU do contêiner mostra a quantidade total de CPU que o serviço usa. É possível observar como o Cloud Run cria mais instâncias quando as atuais usam mais que 0,6 (60%) da CPU. Se a utilização estiver sempre próxima ou acima do limite, o número mínimo de instâncias não é suficiente.

Se essas informações causarem preocupação, implante uma nova revisão usando a interface do Cloud Run. É possível manter a mesma configuração. Isso vai forçar uma reimplantação do ambiente de inclusão de tags no servidor.

Às vezes, a região do Google Cloud em que seu serviço está sendo executado (o padrão é us-central1) pode ter problemas com a disponibilidade de recursos. É possível verificar isso pelo Cloud Logging (consulte abaixo) e pelo painel Google Cloud Service Health.

Cloud Logging

O Cloud Run registra várias informações úteis sobre a integridade do ambiente de forma automática em um serviço do Google Cloud chamado Cloud Logging.

Para consultar os registros do serviço, acesse a Análise de Registros.

Captura de tela de um painel para avaliar registros.
  1. Escolha um período das estatísticas que você quer consultar.
  2. Insira uma consulta para filtrar os registros. Abaixo, você encontra consultas úteis.
  3. Ative o Histograma para conferir as notas de gravidade dos seus registros (por exemplo, Informações, Alerta e Erro).
  4. Clique em qualquer registro na lista para consultar mais detalhes sobre a entrada.

Estas são algumas consultas úteis para ajudar a monitorar a configuração:

Filtrar por erros do sistema

A consulta severity = "ERROR" filtra entradas de registro classificadas como erros de serviço. Ela é útil sempre que você suspeitar que haja uma interrupção do serviço ou algum outro problema com suas instâncias. Por exemplo, uma entrada de registro com gravidade ERROR pode ter a seguinte descrição: ZONE_RESOURCE_POOL_EXHAUSTED. Esse erro significa que o Google Cloud Platform não conseguiu fornecer as instâncias necessárias.

Filtrar por solicitações HTTP com falha

A consulta httpRequest.status >= 400 filtra os registros para mostrar solicitações HTTP a que o Gerenciador de tags do lado do servidor respondeu com um status de erro (status HTTP 400 ou superior).

Os erros 400 normalmente significam que uma solicitação foi enviada para o endpoint de inclusão de tags no servidor, mas não havia um cliente para reivindicar a solicitação. É possível que essas solicitações sejam de bots e rastreadores e possam ser ignoradas. No entanto, se os fluxos de dados resultarem em um erro 400, você terá que analisar a configuração dos clientes do contêiner do servidor.

Os erros 5XX indicam um problema com o próprio serviço do Google Cloud, como verificações de integridade com falha ou problemas no balanceador de carga. Se o seu ambiente estiver com problemas de esgotamento de recursos, normalmente você também vai começar a receber mais desses erros 5XX.

Filtrar registros de saída padrão

A consulta logName: "stdout" retorna o registro de saída padrão do serviço. É um registro útil a ser seguido caso seus recursos do lado do servidor (clientes, tags e variáveis) usem a API de sandbox logToConsole para registrar informações relevantes.

Filtrar solicitações HTTP recebidas

Os registros de retornos de logName: "logs/requests" são referentes às próprias solicitações HTTP recebidas. Eles serão mostrados apenas se você não tiver desativado o registro de solicitações ao executar o script de shell ou adicionar outros filtros de registro.

Clique na linha relevante da lista para abrir os detalhes da solicitação. No entanto, o corpo da solicitação HTTP não vai estar disponível nos registros. Só vamos mostrar o URL da solicitação e outros metadados. Se a solicitação for enviada usando o método POST (com conteúdo codificado no corpo), não será possível buscar esse conteúdo nos registros.

Parabéns por concluir este programa de treinamento!

Responda à pesquisa para nos ajudar a melhorar o curso.

O que fazer agora?

Se você ainda tiver que configurar outras tags, consulte os documentos de inclusão de tags no servidor:

Onde encontro suporte?

Se você precisar de mais ajuda para implementar tags de medição, entre em contato com nossos parceiros certificados ou pergunte à comunidade.