Monitoring

La optimización del rendimiento comienza con la identificación de las métricas clave, por lo general, relacionadas con la latencia y la capacidad de procesamiento. La incorporación de la supervisión para capturar y hacer un seguimiento de estas métricas expone los puntos débiles de la aplicación. Con las métricas, se puede realizar la optimización para mejorar las métricas de rendimiento.

Además, muchas herramientas de supervisión te permiten configurar alertas para las métricas, de modo que se te notifique cuando se alcanza un umbral determinado. Por ejemplo, puedes configurar una alerta para que te notifique cuando el porcentaje de solicitudes con errores aumente en más de un x% de los niveles normales. Las herramientas de supervisión pueden ayudarte a identificar cómo es el rendimiento normal y a identificar aumentos repentinos inusuales de latencia, cantidades de errores y otras métricas clave. La capacidad de supervisar estas métricas es especialmente importante durante los períodos críticos de la empresa o después de que el código nuevo se envíe a producción.

Identifica métricas de latencia

Asegúrate de que tu IU sea lo más responsiva posible, y ten en cuenta que los usuarios esperan estándares aún más altos de las apps para dispositivos móviles. La latencia también debe medirse y rastrearse para los servicios de backend, sobre todo porque puede generar problemas de capacidad de procesamiento si no se marca.

Estas son algunas de las métricas sugeridas para realizar un seguimiento:

  • Duración de la solicitud
  • Duración de las solicitudes con nivel de detalle del subsistema (como llamadas a la API)
  • Duración del trabajo

Identifica las métricas de capacidad de procesamiento

La capacidad de procesamiento es una medida de la cantidad total de solicitudes entregadas durante un período determinado. La capacidad de procesamiento puede verse afectada por la latencia de los subsistemas, por lo que es posible que debas optimizar la latencia para mejorar la capacidad de procesamiento.

Estas son algunas métricas sugeridas para realizar un seguimiento:

  • Consultas por segundo
  • Tamaño de los datos transferidos por segundo
  • Cantidad de operaciones de E/S por segundo
  • El uso de recursos, como el uso de CPU o memoria
  • Tamaño del trabajo pendiente de procesamiento, como Pub/Sub o cantidad de subprocesos

No solo la media

Un error común cuando se mide el rendimiento es solo analizar el caso de la media (promedio). Si bien esto es útil, no proporciona estadísticas sobre la distribución de la latencia. Una métrica mejor para realizar un seguimiento son los percentiles de rendimiento, por ejemplo, el percentil 50, 75, 90 o 99 de una métrica.

En general, la optimización se puede realizar en dos pasos. Primero, optimiza la latencia del percentil 90. Luego, considera el percentil 99, también conocido como latencia final: la pequeña parte de las solicitudes que tardan mucho más en completarse.

Supervisión del servidor para obtener resultados detallados

Por lo general, se prefiere la creación de perfiles del servidor para las métricas de seguimiento. Por lo general, el lado del servidor es mucho más fácil de instrumentar, permite el acceso a datos más detallados y está menos sujeto a perturbaciones por problemas de conectividad.

Supervisión del navegador para obtener visibilidad de extremo a extremo

La generación de perfiles del navegador puede proporcionar estadísticas adicionales sobre la experiencia del usuario final. Puede mostrar qué páginas tienen solicitudes lentas, que luego puedes correlacionar con la supervisión del servidor para realizar un análisis más detallado.

Google Analytics proporciona una supervisión inmediata de los tiempos de carga de las páginas en el informe de tiempos de la página. Esto proporciona varias vistas útiles para comprender la experiencia del usuario en tu sitio, en particular:

  • Tiempos de carga de la página
  • Tiempos de carga de redireccionamiento
  • Tiempos de respuesta del servidor

Supervisión en la nube

Hay muchas herramientas que puedes usar para capturar y supervisar las métricas de rendimiento de tu aplicación. Por ejemplo, puedes usar Google Cloud Logging para registrar las métricas de rendimiento en tu proyecto de Google Cloud y, luego, configurar paneles en Google Cloud Monitoring para supervisar y segmentar las métricas registradas.

Consulta la guía de Logging para ver un ejemplo de registro en Google Cloud Logging desde un interceptor personalizado en la biblioteca cliente de Python. Con esos datos disponibles en Google Cloud, puedes crear métricas sobre los datos registrados para obtener visibilidad de tu aplicación a través de Google Cloud Monitoring. Sigue la guía sobre métricas basadas en registros definidas por el usuario para compilar métricas con los registros enviados a Google Cloud Logging.

Como alternativa, puedes usar las bibliotecas cliente de Monitoring para definir métricas en tu código y enviarlas directamente a Monitoring, aparte de los registros.

Ejemplo de métricas basadas en registros

Supongamos que deseas supervisar el valor is_fault para comprender mejor las tasas de error en tu aplicación. Puedes extraer el valor is_fault de los registros en una métrica de contador nueva, ErrorCount.

Configuración de métricas

Filtros y etiquetas en las métricas

En Cloud Logging, las etiquetas te permiten agrupar las métricas en categorías basadas en otros datos de los registros. Puedes configurar una etiqueta para el campo method enviado a Cloud Logging con el fin de ver cómo se desglosa el recuento de errores según el método de la API de Google Ads.

Con la métrica ErrorCount y la etiqueta Method configuradas, puedes crear un gráfico nuevo en un panel de Monitoring para supervisar ErrorCount, agrupados por Method.

Panel de ErrorCount

Alertas

En Cloud Monitoring y en otras herramientas, es posible configurar políticas de alertas que especifiquen cuándo y cómo deben activarse las alertas con tus métricas. Si deseas obtener instrucciones para configurar alertas de Cloud Monitoring, sigue la guía de alertas.