Travailler avec le bruit

Découvrez comment utiliser, prendre en compte et réduire l'impact du bruit dans vos rapports agrégables.

Avant de commencer

Avant de continuer, pour comprendre en détail ce qu'est le bruit et son impact, consultez Comprendre le bruit dans les rapports récapitulatifs.

Vos commandes du bruit

Vous ne pouvez pas contrôler directement le bruit ajouté à vos rapports agrégables, mais vous pouvez prendre certaines mesures pour en minimiser les effets. Les sections suivantes décrivent ces stratégies.

Augmenter la capacité selon le budget de contribution

Comme expliqué dans la section "Comprendre le bruit", le bruit appliqué à la valeur récapitulative pour chaque clé est basé sur une échelle de 0 à 65 536 (0 à CONTRIBUTION_BUDGET).

La répartition du bruit est basée sur le budget.

Par conséquent, pour optimiser le signal par rapport au bruit, vous devez augmenter la capacité de chaque valeur avant de la définir en tant que valeur agrégable, c'est-à-dire multiplier chaque valeur par un certain facteur (le facteur de scaling), tout en vous assurant qu'elle respecte le budget de contribution.

Bruit relatif avec et sans ajustement.

Calcul d'un facteur de scaling

Le facteur de scaling représente le scaling que vous souhaitez appliquer à une valeur agrégable donnée. Sa valeur doit correspondre au budget de contribution divisé par la valeur agrégable maximale d'une clé donnée.

Déterminer le facteur de scaling en fonction du budget de contribution.

Par exemple, supposons que les annonceurs souhaitent connaître la valeur totale des achats. Vous savez que la valeur d'achat maximale attendue d'un achat individuel est de 2 000 €, à l'exception de quelques anomalies que vous décidez d'ignorer:

  • Calculez le facteur de scaling :
    • Pour maximiser le rapport signal sur bruit, vous devez définir cette valeur sur 65 536 (budget de contribution).
    • On obtient ainsi un facteur de mise à l'échelle d'environ 32x de 65 536 / 2 000. En pratique, vous pouvez arrondir ce facteur à la hausse ou à la baisse.
  • Augmentez vos valeurs avant l'agrégation. Pour chaque €1 d'achat, incrémentez la métrique suivie de 32. Par exemple, pour un achat de 120 €, définissez une valeur agrégée de 120 x 32 = 3 840.
  • Réduire vos valeurs après l'agrégation. Une fois que vous avez reçu le rapport récapitulatif contenant la valeur des achats additionnée pour plusieurs utilisateurs, réduisez la valeur récapitulative à l'aide du facteur de scaling que vous avez utilisé avant l'agrégation. Dans notre exemple, nous avons utilisé un facteur de mise à l'échelle de 32 lors de la préagrégation. Nous devons donc diviser par 32 la valeur récapitulative reçue dans le rapport récapitulatif. Par conséquent, si la valeur d'achat récapitulative d'une clé donnée dans le rapport de synthèse est de 76 800, la valeur des achats récapitulatifs (avec bruit) est de 76 800/32 = 2 400 $.

Répartissez votre budget

Si vous avez plusieurs objectifs de mesure (par exemple, le nombre d'achats et la valeur des achats), vous pouvez répartir votre budget entre eux.

Dans ce cas, vos facteurs de scaling seront différents pour différentes valeurs agrégables, en fonction du maximum attendu d'une valeur agrégable donnée.

Pour en savoir plus, consultez Comprendre les clés d'agrégation.

Par exemple, supposons que vous suiviez à la fois le nombre d'achats et la valeur des achats, et que vous décidiez d'allouer votre budget de manière égale.

65 536 / 2 = 32 768 peuvent être alloués par type de mesure et par source.

  • Nombre d'achats :
    • Vous ne suivez qu'un seul achat. Par conséquent, le nombre maximal d'achats pour une conversion donnée est de 1.
    • Par conséquent, vous décidez de définir votre facteur de scaling pour le nombre d'achats sur 32 768 / 1 = 32 768.
  • Valeur des achats :
    • Supposons que la valeur d'achat maximale attendue d'un achat individuel soit de 2 000 €.
    • Par conséquent, vous décidez de définir votre facteur de scaling pour la valeur des achats sur 32 768 / 2 000 = 16,384 ou sur une valeur d'environ 16.

Des clés d'agrégation plus grossières améliorent le rapport signal/bruit

Étant donné que les clés générales enregistrent plus d'événements de conversion que les clés précises, elles génèrent généralement des valeurs récapitulatives plus élevées.

Les valeurs récapitulatives élevées sont moins affectées par le bruit que les valeurs basses. Le bruit sur ces valeurs est susceptible d'être plus faible par rapport à cette valeur.

Les valeurs collectées avec des clés plus grossières sont susceptibles d'être relativement moins bruyantes que les valeurs collectées avec des clés plus précises.

Exemple

Toutes les autres valeurs étant égales, une clé qui suit la valeur des achats à l'échelle mondiale (cumulée dans tous les pays) génère une valeur récapitulative des achats plus élevée (et un nombre de conversions récapitulatif plus élevé) qu'une clé qui suit les conversions au niveau d'un pays.

Par conséquent, le bruit relatif sur la valeur totale des achats pour un pays spécifique sera plus élevé que le bruit relatif sur la valeur totale des achats pour tous les pays.

De même, si toutes les autres métriques sont égales, la valeur totale des achats de chaussures est inférieure à la valeur totale des achats de tous les articles (y compris les chaussures).

Par conséquent, le bruit relatif sur la valeur totale des achats pour les chaussures sera plus élevé que le bruit relatif sur la valeur totale des achats pour tous les articles.

Impact du bruit avec des touches précises ou approximatives

La somme des valeurs récapitulatives (cumuls) permet également de calculer le bruit

En additionnant les valeurs récapitulatives de vos rapports de synthèse pour accéder à des données de niveau supérieur, vous additionnez également le bruit de ces valeurs récapitulatives.

Degré de bruit avec des clés précises avec cumul par rapport à des clés générales sans cumul

Examinons deux approches différentes : - Méthode A: vous incluez un ID géographique dans vos clés. Les rapports de synthèse présentent des clés au niveau de l'ID géographique, chacune associée à la valeur récapitulative des achats à un niveau spécifique de l'ID géographique. - Méthode B: vous n'incluez pas d'identifiant géographique dans vos clés. Les rapports récapitulatifs indiquent directement la valeur récapitulative des achats pour tous les identifiants géographiques et toutes les zones géographiques.

Pour accéder à la valeur des achats au niveau du pays : - Avec l'approche A, vous additionnez les valeurs récapitulatives au niveau de l'identifiant géographique et, par conséquent, leur bruit. Cela risque d'entraîner davantage de bruit ajouté à la valeur d'achat finale au niveau de l'ID géographique. - Avec l'approche B, vous examinez directement les données exposées dans les rapports de synthèse. Le bruit n'a été ajouté qu'une seule fois à ces données.

Par conséquent, la valeur récapitulative des achats pour un ID géographique donné risque d'être plus bruyante avec l'approche A.

De même, l'ajout d'une dimension au niveau du code postal dans vos clés entraînera probablement davantage de bruit dans les résultats que l'utilisation de clés plus grosses avec une dimension au niveau de la région.

L'agrégation sur des périodes plus longues augmente le rapport signal/bruit.

Si vous demandez des rapports de synthèse moins souvent, cela signifie que chaque valeur récapitulative sera probablement plus élevée que si vous aviez demandé des rapports plus souvent. Davantage de conversions risquent de se produire sur des périodes plus longues.

Comme indiqué précédemment, plus la valeur récapitulative est élevée, plus le bruit relatif est susceptible d'être faible. Par conséquent, la demande moins fréquente de rapports récapitulatifs entraîne un meilleur rapport signal/bruit.

L'envoi moins fréquent de demandes de rapports récapitulatifs aboutit à un rapport signal/bruit plus élevé.

Voici un exemple:

  • Si vous demandez des rapports récapitulatifs horaires sur 24 heures, puis que vous additionnez la valeur récapitulative de chaque rapport horaire pour accéder aux données au niveau du jour, du bruit est ajouté 24 fois.
  • Dans un rapport récapitulatif quotidien, le bruit n'est ajouté qu'une seule fois.

Epsilon plus élevé, bruit plus faible

Plus la valeur epsilon est élevée, plus le bruit et la protection de la confidentialité sont faibles.

Tirer parti du filtrage et de la déduplication

Pour répartir le budget entre différentes clés, il est important de comprendre combien de fois un événement donné peut se produire. Par exemple, un annonceur peut ne s'intéresser qu'à un seul achat par clic, mais être intéressé par un maximum de trois conversions "page produit". Pour prendre en charge ces cas d'utilisation, vous pouvez également exploiter les fonctionnalités d'API suivantes, qui vous permettent de contrôler le nombre de rapports générés et les conversions comptabilisées:

Expérimenter epsilon

Les technologies publicitaires peuvent définir epsilon sur une valeur supérieure à 0, et jusqu'à 64 (inclus). Cette plage permet d'effectuer des tests flexibles. Des valeurs inférieures à epsilon améliorent la protection de la confidentialité. Nous vous recommandons de commencer par epsilon=10.

Recommandations à tester

Nous vous recommandons ce qui suit : - Commencez par epsilon = 10. - Si cela entraîne des problèmes d'utilité notables, augmentez progressivement la puissance d'epsilon. - Partagez vos commentaires sur des points d'inflexion spécifiques que vous pourriez trouver en ce qui concerne la facilité d'utilisation des données.

Interagir et partager des commentaires

Vous pouvez participer et tester cette API.

Étapes suivantes