La confidentialité des utilisateurs finaux est au cœur de toutes les activités d'Ads Data Hub. C'est sur cette base que repose notre plate-forme. Afin de protéger cette confidentialité et d'aider nos clients à respecter les réglementations, nous imposons certaines vérifications et restrictions. L'objectif est d'empêcher la transmission d'informations concernant des utilisateurs individuels1 dans les données obtenues à partir de la plate-forme.
Voici un aperçu des fonctionnalités de confidentialité d'Ads Data Hub, avec des informations plus détaillées dans les sections suivantes:
- Les vérifications statiques permettent d'examiner les instructions dans vos requêtes afin de détecter les problèmes de confidentialité flagrants et immédiats.
- Les budgets d'accès aux données limitent le nombre total de fois que vous pouvez accéder à une donnée spécifique.
- Les vérifications d'agrégation permettent de vérifier que chaque ligne contient un nombre suffisant d'utilisateurs pour protéger la confidentialité des utilisateurs finaux.
- Les vérifications des différences (ou "diff checks") comparent les ensembles de résultats pour vous aider à éviter de collecter des informations sur des utilisateurs individuels en comparant les données de plusieurs ensembles d'utilisateurs.
- L'injection de bruit constitue une alternative aux vérifications des différences. Le mode bruit n'est disponible que dans l'interface Ads Data Hub pour les marketeurs. Pour en savoir plus sur l'injection de bruit, consultez cette page sur le site Ads Data Hub pour les marketeurs.
Si un résultat échoue aux contrôles de confidentialité, Ads Data Hub affiche ou renvoie un message sur la confidentialité vous informant qu'une ligne a été filtrée. La quantité de données filtrées peut aller d'une seule ligne à un ensemble de résultats complet. Afin de vérifier que les totaux de vos rapports sont corrects, utilisez un récapitulatif des lignes filtrées pour comptabiliser les données des lignes supprimées2.
Vérifications statiques
Les vérifications statiques permettent d'examiner les instructions dans vos requêtes afin de détecter des problèmes de confidentialité flagrants, comme l'exportation d'identifiants utilisateur, toute fonction d'identifiants utilisateur ou encore l'utilisation de fonctions non autorisées sur les champs qui contiennent des données utilisateur. Pour éviter les erreurs de requête dues aux vérifications statiques, consultez les bonnes pratiques et identifiez les fonctions autorisées.
Budget d'accès aux données
Votre budget d'accès aux données limite le nombre total de fois que vous pouvez accéder à une donnée spécifique. Un message de confidentialité de type DATA_ACCESS_BUDGET_IS_NEARLY_EXHAUSTED
s'affiche lorsque les utilisateurs approchent de la limite du budget. Vous pouvez surveiller le budget à l'aide du point d'entrée budget d'accès aux données ou des notifications sur le budget dans l'interface utilisateur.
Exigences d'agrégation
Le seuil d'agrégation des utilisateurs est au cœur des contrôles de confidentialité d'Ads Data Hub. Pour la plupart des requêtes, vous ne pouvez recevoir des données de rapport que pour 50 utilisateurs ou plus. Toutefois, les requêtes qui n'accèdent qu'aux clics et aux conversions peuvent être utilisées pour générer des rapports sur 10 utilisateurs ou plus.
- Les événements associés à des ID utilisateur nuls sont comptabilisés comme provenant d'un seul utilisateur dans le cadre du seuil d'agrégation, quel que soit le nombre réel d'utilisateurs ayant créé les événements.
- Les utilisateurs avec des identifiants nuls ne sont pas pris en compte dans le seuil d'agrégation.
Bonne pratique: Configurez un récapitulatif des lignes filtrées pour générer des rapports sur les données omises. Vous pourrez ainsi conserver une référence cohérente dans vos rapports.
Dans l'exemple suivant, la ligne contenant la campagne 125 serait exclue des résultats finaux, car elle regroupe les résultats de 48 utilisateurs, soit moins que le nombre minimal requis (50).
ID de la campagne | Utilisateurs | Impressions |
---|---|---|
123 | 314 | 928 |
124 | 2 718 | 5 772 |
125 | 48 | 353 |
Vérification des différences
La vérification des différences permet de s'assurer que les utilisateurs ne sont pas identifiables en comparant plusieurs résultats suffisamment agrégés de différentes manières :
- Elles comparent les résultats de la tâche que vous exécutez à vos résultats précédents.
- Elles comparent les lignes d'un même ensemble de résultats.
Lors de la vérification des différences, des infractions peuvent se produire si vous modifiez vos données sous-jacentes entre deux tâches. Lorsque vous comparez les résultats d'une tâche à des résultats précédents, Ads Data Hub recherche des failles au niveau des utilisateurs individuels. C'est pourquoi vous pouvez filtrer les résultats provenant de différentes campagnes, ou ceux qui indiquent le même nombre d'utilisateurs, s'ils comportent beaucoup d'utilisateurs qui se chevauchent.
D'autre part, deux ensembles de résultats agrégés peuvent avoir le même nombre d'utilisateurs (ils semblent identiques), mais ne pas partager d'utilisateurs individuels. Dans ce cas, ils respectent la confidentialité et ne seront pas filtrés.
Ads Data Hub utilise les données de l'historique de vos résultats lorsqu'il tient compte de la vulnérabilité d'un nouveau résultat. Par conséquent, exécuter une même requête de manière répétée crée davantage de données à utiliser pour les vérifications de différences lorsque vous examinez la vulnérabilité d'un nouveau résultat. En outre, les données sous-jacentes peuvent changer, ce qui entraîne des infractions lors des contrôles de confidentialité pour les requêtes considérées comme stables.
Lorsque les résultats au niveau du job présentent des différences suffisantes, mais qu'une ligne individuelle est semblable à celle d'un job précédent, Ads Data Hub la filtre. Dans cet exemple, la ligne contenant la campagne 123 dans les résultats de la deuxième tâche sera filtrée, car la différence entre cette ligne et la précédente n'est que d'un seul utilisateur.
|
|
Si la somme des utilisateurs de toutes les lignes d'un ensemble de résultats est semblable à celle d'un job précédent, Ads Data Hub filtre l'ensemble entier. Dans cet exemple, tous les résultats de la deuxième tâche seront filtrés.
|
|
Récapitulatif des lignes filtrées
Les récapitulatifs des lignes filtrées regroupent les données filtrées suite à des contrôles de confidentialité. Les données des lignes filtrées sont additionnées et ajoutées à une ligne collectrice. Bien que les données filtrées ne puissent pas être analysées plus en détail, elles fournissent un récapitulatif du volume de données exclu des résultats.
Filtrage explicite de la confidentialité
Si vous devez diviser votre requête, mais que vous souhaitez combiner les résultats agrégés, vous pouvez appliquer explicitement des vérifications de confidentialité à plusieurs requêtes plus petites, puis agréger ces résultats de manière respectueuse de la confidentialité.
Exemples de cas d'utilisation :
- Vous êtes annonceur et recherchez toutes les conversions par type d'événement d'attribution dans votre compte Google Ads associé, qui inclut des données de l'EEE.
- Vous êtes un partenaire de mesure et vous recherchez toutes les conversions par type d'événement d'attribution dans votre compte Google Ads associé.
Pour obtenir la somme des conversions de votre compte Google Ads, vous pouvez réécrire la requête à l'aide d'une clause OPTIONS(privacy_checked_export=TRUE)
afin d'appliquer des vérifications de confidentialité à chaque service Google individuellement.
L'exemple de réécriture de cette section effectue ce qui suit:
- Il interroge chaque service Google individuellement, en appliquant explicitement des vérifications de confidentialité à chaque ensemble de résultats intermédiaires.
- Il crée une table temporaire distincte pour les résultats de vérification de la confidentialité de chaque service Google: YouTube, Gmail et Network.
- Il agrège et additionne les nombres de conversions vérifiés en termes de confidentialité des tables temporaires.
CREATE TEMP TABLE youtube_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_youtube
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
CREATE TEMP TABLE network_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_network
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
CREATE TEMP TABLE gmail_agg OPTIONS(privacy_checked_export=TRUE) AS
SELECT
impression_data.campaign_id,
attribution_event_type,
COUNT(1) AS num_convs
FROM adh.google_ads_conversions_policy_isolated_gmail
WHERE impression_data.campaign_id IN UNNEST(@campaign_ids)
AND conversion_type IN UNNEST(@conversion_type_list)
GROUP BY campaign_id, attribution_event_type;
SELECT
campaign_id,
attribution_event_type,
SUM(num_convs) AS num_convs
FROM (
SELECT * FROM youtube_agg
UNION ALL
SELECT * FROM network_agg
UNION ALL
SELECT * FROM gmail_agg
)
GROUP BY campaign_id, attribution_event_type
Notez que cette requête n'utilise pas de JOIN
pour combiner directement les données entre les tables, mais effectue d'abord la requête pour chaque table, applique des contrôles de confidentialité à chaque table intermédiaire, puis utilise un UNION
pour additionner les valeurs soumises à des contrôles de confidentialité.
Query Advisor
Si votre requête SQL est valide, mais qu'elle peut déclencher un filtrage excessif, Query Advisor affiche des conseils concrets lors du processus de développement de la requête pour vous aider à éviter les résultats indésirables.
Les motifs suivants peuvent être des déclencheurs :
- Associer des sous-requêtes agrégées
- Associer des données non agrégées à des utilisateurs potentiellement différents
- Tables temporaires définies de manière récursive
Pour utiliser Query Advisor :
- Interface utilisateur : des recommandations s'affichent au-dessus du texte de la requête dans l'éditeur.
- API : utilisez la méthode
customers.analysisQueries.validate
.
-
Sauf les données qu'ils ont accepté de partager, comme dans le cas de panélistes. ↩
-
Sauf en cas de restrictions liées à la confidentialité, par exemple lorsque les utilisateurs figurant dans un récapitulatif des lignes filtrées ne respectent pas les exigences d'agrégation. ↩