Se usó la API de Cloud Translation para traducir esta página.

Prácticas recomendadas

Las siguientes prácticas recomendadas te proporcionarán técnicas para desarrollar consultas centradas en la privacidad y con un buen rendimiento. Para conocer las prácticas recomendadas específicas para ejecutar consultas en el modo de ruido, consulta las secciones sobre patrones de consultas admitidos y no admitidos en Inyección de ruido.

Privacidad y precisión de los datos

Desarrollar consultas sobre datos de zona de pruebas

Práctica recomendada: Solo consulta los datos de producción cuando estés en producción.

Siempre que sea posible, utiliza datos de zona de pruebas durante el desarrollo de tus consultas. Los trabajos que usan datos de zona de pruebas no introducen oportunidades adicionales para que las verificaciones de diferencias filtren los resultados de tu búsqueda. Además, debido a la falta de verificaciones de privacidad, las consultas de la zona de pruebas se ejecutan más rápido, lo que permite una iteración más rápida durante el desarrollo de las consultas.

Si debes desarrollar consultas sobre tus datos reales (por ejemplo, cuando usas tablas de correlación), para reducir la probabilidad de que se superpongan las filas, elige rangos de fechas y otros parámetros que no se superpongan en cada iteración de tu consulta. Por último, ejecuta la consulta en el rango de datos deseado.

Considera cuidadosamente los resultados históricos

Práctica recomendada: Disminuye la probabilidad de que se superpongan los conjuntos de resultados entre las consultas ejecutadas recientemente.

Ten en cuenta que la tasa de cambio entre los resultados de la búsqueda afectará la probabilidad de que se omitan resultados más adelante debido a las verificaciones de privacidad. Es probable que se descarte un segundo conjunto de resultados que se parezca mucho a un conjunto de resultados que se devolvió recientemente.

En su lugar, modifica los parámetros clave de tu búsqueda, como los períodos o los IDs de campaña, para disminuir la probabilidad de que haya una superposición significativa.

No consultes los datos de hoy

Práctica recomendada: No ejecutes varias consultas en las que la fecha de finalización sea hoy.

Ejecutar varias consultas con fechas de finalización iguales a la fecha actual suele generar que se filtren filas. Esta guía también se aplica a la ejecución de consultas poco después de la medianoche sobre los datos del día anterior.

No consultes los mismos datos más de lo necesario

Recomendaciones:

Selecciona fechas de inicio y finalización que estén estrechamente vinculadas.
En lugar de consultar ventanas superpuestas, ejecuta tus consultas en conjuntos de datos disjuntos y, luego, agrega los resultados en BigQuery.
Usar los resultados guardados en lugar de volver a ejecutar la consulta
Crea tablas temporales para cada período que consultas.

El Centro de Datos de Anuncios restringe la cantidad total de veces que puedes consultar los mismos datos. Por lo tanto, debes intentar limitar la cantidad de veces que accedes a un dato determinado.

No uses más agregaciones de las necesarias en la misma consulta.

Prácticas recomendadas

Minimiza la cantidad de agregaciones en una consulta
Vuelve a escribir las consultas para combinar agregaciones cuando sea posible

Ads Data Hub limita a 100 la cantidad de agregaciones entre usuarios que se pueden usar en una subconsulta. Por lo tanto, en general, recomendamos escribir consultas que generen más filas con claves de agrupación enfocadas y agregaciones simples, en lugar de más columnas con claves de agrupación amplias y agregaciones complejas. Se debe evitar el siguiente patrón:

SELECT
  COUNTIF(field_1 = a_1 AND field_2 = b_1) AS cnt_1,
  COUNTIF(field_1 = a_2 AND field_2 = b_2) AS cnt_2
FROM
  table

Las consultas que cuentan eventos según el mismo conjunto de campos se deben volver a escribir con la instrucción GROUP BY.

SELECT
  field_1,
  field_2,
  COUNT(1) AS cnt
FROM
  table
GROUP BY
  1, 2

El resultado se puede agregar de la misma manera en BigQuery.

Las consultas que crean columnas a partir de un array y, luego, las agregan, se deben volver a escribir para combinar estos pasos.

SELECT
  COUNTIF(a_1) AS cnt_1,
  COUNTIF(a_2) AS cnt_2
FROM
  (SELECT
     1 IN UNNEST(field) AS a_1,
     2 IN UNNEST(field) AS a_2,
   FROM
     table)

La consulta anterior se puede reescribir de la siguiente manera:

SELECT f, COUNT(1) FROM table, UNNEST(field) AS f GROUP BY 1

Las consultas que usan diferentes combinaciones de campos en diferentes agregaciones se pueden reescribir en varias consultas más enfocadas.

SELECT
  COUNTIF(field_1 = a_1) AS cnt_a_1,
  COUNTIF(field_1 = b_1) AS cnt_b_1,
  COUNTIF(field_2 = a_2) AS cnt_a_2,
  COUNTIF(field_2 = b_2) AS cnt_b_2,
FROM table

La consulta anterior se puede dividir de la siguiente manera:

SELECT
  field_1, COUNT(*) AS cnt
FROM table
GROUP BY 1

SELECT
  field_2, COUNT(*) AS cnt
FROM table
GROUP BY 1

Puedes dividir estos resultados en consultas separadas, crear y unir las tablas en una sola consulta o combinarlas con un operador UNION si los esquemas son compatibles.

Optimiza y comprende las uniones

Práctica recomendada: Usa un LEFT JOIN en lugar de un INNER JOIN para unir clics o conversiones a las impresiones.

No todas las impresiones se asocian con clics o conversiones. Por lo tanto, si INNER JOIN los clics o las conversiones en las impresiones, se filtrarán de tus resultados las impresiones que no estén vinculadas a clics o conversiones.

Imagen que muestra varios tipos de unión a través de diagramas de Venn

Une algunos resultados finales en BigQuery

Práctica recomendada: Evita las consultas de Ads Data Hub que unen resultados agregados. En su lugar, escribe 2 consultas separadas y une los resultados en BigQuery.

Las filas que no cumplen con los requisitos de agregación se filtran de los resultados. Por lo tanto, si tu consulta une una fila insuficientemente agregada con una fila suficientemente agregada, se filtrará la fila resultante. Además, las consultas con varias agregaciones tienen un rendimiento menor en Ads Data Hub.

Puedes unir los resultados (en BigQuery) de varias consultas de agregación (desde Ads Data Hub). Los resultados calculados con búsquedas comunes compartirán esquemas finales.

La siguiente consulta toma los resultados individuales de Ads Data Hub (campaign_data_123 y campaign_data_456) y los une en BigQuery:

SELECT t1.campaign_id, t1.city, t1.X, t2.Y
FROM `campaign_data_123` AS t1
FULL JOIN `campaign_data_456` AS t2
USING (campaign_id, city)

Cómo usar resúmenes de filas filtradas

Práctica recomendada: Agrega resúmenes de filas filtradas a tus consultas.

Los resúmenes de filas filtradas registran los datos que se filtraron debido a las verificaciones de privacidad. Los datos de las filas filtradas se suman y se agregan a una fila de captura general. Si bien los datos filtrados no se pueden analizar más, proporcionan un resumen de la cantidad de datos que se filtraron de los resultados.

Considera los IDs de usuario establecidos en cero

Práctica recomendada: Ten en cuenta los IDs de usuario establecidos en cero en tus resultados.

El ID de un usuario final se puede establecer en 0 por varios motivos, como la inhabilitación de la personalización de anuncios, motivos reglamentarios, etcétera. Por lo tanto, los datos que provienen de varios usuarios se asociarán a una user_id de 0.

Si deseas comprender los totales de datos, como las impresiones o los clics totales, debes incluir estos eventos. Sin embargo, estos datos no serán útiles para obtener estadísticas sobre los clientes y se deben filtrar si realizas este tipo de análisis.

Puedes excluir estos datos de tus resultados agregando WHERE user_id != "0" a tus consultas.

Rendimiento

Evita la reagregación

Práctica recomendada: Evita varias capas de agregación en los usuarios.

Las consultas que combinan resultados que ya se agregaron, como en el caso de una consulta con varios GROUP BY o una agregación anidada, requieren más recursos para procesarse.

A menudo, las consultas con varias capas de agregación se pueden dividir, lo que mejora el rendimiento. Debes intentar mantener las filas a nivel del evento o del usuario durante el procesamiento y, luego, combinarlas con una sola agregación.

Se deben evitar los siguientes patrones:

SELECT SUM(count)
FROM
  (SELECT campaign_id, COUNT(0) AS count FROM ... GROUP BY 1)

Las consultas que usan varias capas de agregación se deben volver a escribir para usar una sola capa de agregación.

(SELECT ... GROUP BY ... )
JOIN USING (...)
(SELECT ... GROUP BY ... )

Las búsquedas que se pueden dividir fácilmente deben dividirse. Puedes unir resultados en BigQuery.

Optimiza para BigQuery

En general, las consultas que hacen menos trabajo funcionan mejor. Cuando se evalúa el rendimiento de las consultas, la cantidad de trabajo requerido depende de los siguientes factores:

Datos de entrada y fuentes de datos (E/S): ¿cuántos bytes lee tu consulta?
Comunicación entre nodos (redistribución): ¿Cuántos bytes pasa tu consulta a la siguiente etapa?
Procesamiento: ¿cuánto trabajo de CPU requiere tu consulta?
Salidas (materialización): ¿cuántos bytes escribe tu consulta?
Antipatrones de consulta: tus consultas ¿siguen las recomendaciones de SQL?

Si la ejecución de consultas no cumple con tus acuerdos de nivel de servicio o si encuentras errores debido a agotamiento de recursos o tiempo de espera, considera lo siguiente:

Usar los resultados de consultas anteriores en lugar de volver a calcularlos Por ejemplo, tu total semanal podría ser la suma calculada en BigQuery de 7 consultas agregadas de un solo día.
Descomponer las consultas en subconsultas lógicas (por ejemplo, dividir varias uniones en varias consultas) o restringir de alguna otra manera el conjunto de datos que se procesan Puedes combinar los resultados de trabajos individuales en un solo conjunto de datos en BigQuery. Si bien esto puede ayudar a evitar el agotamiento de recursos, es posible que ralentice la consulta.
Si tienes errores de recursos excedidos en BigQuery, intenta usar tablas temporales para dividir tu consulta en varias consultas de BigQuery.
Hacer referencia a menos tablas en una sola consulta, ya que esto usa grandes cantidades de memoria y puede hacer que la consulta falle
Reescribir tus consultas para que unan menos tablas de usuarios
Reescribimos tus consultas para evitar unir la misma tabla consigo misma.

Asesor de consultas

Si tu código SQL es válido, pero podría activar un filtrado excesivo, el asesor de consultas te brinda sugerencias prácticas durante el proceso de desarrollo de la consulta para ayudarte a evitar resultados no deseados.

Los activadores incluyen los siguientes patrones:

Cómo unir subconsultas agregadas
Unir datos sin agregar con usuarios potencialmente diferentes
Tablas temporales definidas de forma recursiva

Para usar el asesor de consultas, haz lo siguiente:

IU Las recomendaciones aparecerán en el editor de consultas, sobre el texto de la consulta.
API. Usa el método customers.analysisQueries.validate.