Découvrez ce que signifie le bruit, où il est ajouté et comment il affecte vos efforts de mesure.
Les rapports récapitulatifs sont le résultat de l'agrégation de rapports agrégables. Lorsque des rapports agrégables sont regroupés par un collecteur et traités par le service d'agrégation, du bruit (une quantité aléatoire de données) est ajouté aux rapports récapitulatifs qui en résultent. Un bruit est ajouté pour protéger la confidentialité des utilisateurs. L'objectif de ce mécanisme est de disposer d'un framework pouvant prendre en charge les mesures à confidentialité différentielle.

Présentation du bruit dans les rapports récapitulatifs
Bien que l'ajout de bruit ne fasse généralement pas partie de la mesure des annonces aujourd'hui, dans de nombreux cas, le bruit ajouté ne changera pas sensiblement la façon dont vous interpréterez vos résultats.
Vous pouvez réfléchir à la question suivante : seriez-vous en mesure de prendre une décision en vous appuyant sur un certain élément de données s'il n'était pas bruyant ?
Par exemple, un annonceur peut-il modifier sa stratégie ou ses budgets de campagne en se basant sur le fait que la campagne A a généré 15 conversions et la campagne B 16 ?
Si la réponse est non, le bruit n'a aucune importance.
Vous devez configurer l'utilisation de votre API de manière à:
- La réponse à la question ci-dessus est oui.
- Le bruit est géré de manière à ne pas avoir d'impact significatif sur votre capacité à prendre une décision en vous basant sur certaines données. Vous pouvez procéder comme suit: pour un nombre minimal de conversions attendu, vous devez maintenir le bruit dans la métrique collectée en dessous d'un certain pourcentage.
Dans cette section et la suivante, nous allons décrire des stratégies pour atteindre cet objectif.
Concepts fondamentaux
Le service d'agrégation ajoute du bruit une fois à chaque valeur récapitulative (une fois par clé) chaque fois qu'un rapport récapitulatif est demandé.
Ces valeurs de bruit sont tirées de manière aléatoire d'une distribution de probabilité spécifique, décrite ci-dessous.
Tous les éléments qui ont un impact sur le bruit reposent sur deux concepts principaux.
La distribution du bruit (détails ci-dessous) est la même, que la valeur récapitulative soit basse ou élevée. Par conséquent, plus la valeur récapitulative est élevée, moins le bruit est susceptible d'avoir un impact par rapport à cette valeur.
Par exemple, imaginons qu'une valeur d'achat totale agrégée de 20 000 $et une valeur d'achat totale agrégée de 200 $soient soumises à un bruit sélectionné dans la même distribution.
Supposons que le bruit de cette distribution varie approximativement entre -100 et +100.
- Pour la valeur d'achat récapitulative de 20 000 $, le bruit varie entre 0 et 100/20 000=0,5%.
- Pour la valeur d'achat récapitulative de 200 $, le bruit varie entre 0 et 100/200=50%.
Par conséquent, le bruit aura probablement un impact moindre sur la valeur d'achat globale de 20 000 $que sur celle de 200 $. Relativement parlant, 20 000 $ est susceptible d'être moins bruyant, c'est-à-dire d'avoir un rapport signal/bruit plus élevé.
Cela a quelques conséquences pratiques importantes, qui sont décrites dans la section suivante. Ce mécanisme fait partie de la conception de l'API, et les implications pratiques sont à long terme. Ils continueront de jouer un rôle important dans la conception et l'évaluation des différentes stratégies d'agrégation des technologies publicitaires.
Bien que le bruit soit tiré de la même distribution quelle que soit la valeur récapitulative, cette distribution dépend de plusieurs paramètres. L'un de ces paramètres, epsilon, peut être modifié par les technologies publicitaires pendant le test d'origine terminé afin d'évaluer divers ajustements d'utilité/de confidentialité. Toutefois, considérez la possibilité d'ajuster epsilon comme temporaire. N'hésitez pas à nous faire part de vos commentaires sur vos cas d'utilisation et les valeurs d'épsilon qui fonctionnent bien.
Bien qu'une entreprise de technologie publicitaire n'ait pas le contrôle direct des méthodes d'ajout de bruit, elle peut influencer l'impact du bruit sur ses données de mesure. Dans les sections suivantes, nous verrons comment le bruit peut être influencé dans la pratique.
Avant de le faire, examinons de plus près la façon dont le bruit est appliqué.
Zoom avant: application du bruit
Une distribution de bruit
Le bruit est extrait de la distribution de Laplace, avec les paramètres suivants:
- Une moyenne (
μ
) de 0. Cela signifie que la valeur de bruit la plus probable est 0 (aucun bruit ajouté) et que la valeur bruitée est aussi susceptible d'être inférieure à l'originale que supérieure (on parle parfois de biais nul). - Paramètre d'échelle de
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
est défini dans le navigateur.epsilon
est utilisé dans le service d'agrégation.
Le diagramme suivant montre la fonction de densité de probabilité d'une distribution de Laplace avec μ=0 et b = 20:

Valeurs de bruit aléatoires, une distribution de bruit
Supposons qu'une technologie publicitaire demande des rapports récapitulatifs pour deux clés d'agrégation, key1 et key2.
Le service d'agrégation sélectionne deux valeurs de bruit x1 et x2, selon la même distribution de bruit. x1 est ajouté à la valeur récapitulative pour key1, et x2 est ajouté à la valeur récapitulative pour key2.
Dans les diagrammes, nous représenterons les valeurs de bruit comme identiques. Il s'agit d'une simplification. En réalité, les valeurs de bruit varient, car elles sont extraites de manière aléatoire de la distribution.
Cela montre que les valeurs de bruit proviennent toutes de la même distribution et sont indépendantes de la valeur récapitulative à laquelle elles sont appliquées.
Autres propriétés du bruit
Le bruit est appliqué à chaque valeur récapitulative, y compris les valeurs vides (0).

Par exemple, même si la valeur récapitulative réelle d'une clé donnée est 0, la valeur récapitulative bruyante que vous verrez dans le rapport récapitulatif de cette clé ne sera probablement pas 0.
Le bruit peut être un nombre positif ou négatif.

Par exemple, pour un montant d'achat avant bruit de 327 000 €, le bruit peut être de +6 000 ou de -6 000 (il s'agit d'exemples de valeurs arbitraires).
Évaluer le bruit
Calculer l'écart type du bruit
L'écart type du bruit est le suivant:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Exemple
Avec epsilon = 10, l'écart type du bruit est le suivant:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Évaluer si les différences de mesure sont significatives
Étant donné que vous connaissez la déviation standard du bruit ajouté à chaque valeur renvoyée par le service d'agrégation, vous pouvez déterminer les seuils appropriés pour la comparaison afin de déterminer si les différences observées peuvent être dues au bruit.
Par exemple, si le bruit ajouté à une valeur est d'environ +/- 10 (en tenant compte de la mise à l'échelle) et que la différence de valeur entre deux campagnes est supérieure à 100, il est probablement possible de conclure que la différence de valeur mesurée entre chaque campagne n'est pas uniquement due au bruit.
Interagir et partager des commentaires
Vous pouvez participer et tester cette API.
- Découvrez les rapports agrégables et le service d'agrégation, posez des questions et suggérez des commentaires.
- Consultez les guides sur l'attribution de rapports.
- Posez des questions et participez à des discussions dans le dépôt de l'assistance Privacy Sandbox pour les développeurs.
Étapes suivantes
- Pour connaître les variables que vous pouvez contrôler pour améliorer le rapport signal/bruit, consultez Gérer le bruit.
- Consultez Expérimenter des décisions de conception de rapports récapitulatifs pour vous aider à planifier vos stratégies de reporting d'agrégation.
- Suivez l'atelier sur le bruit.