Scopri cosa si intende per rumore, dove viene aggiunto e in che modo influisce sulle tue attività di misurazione.
I report di riepilogo sono il risultato dell'aggregazione dei report aggregabili. Quando i report aggregabili vengono raggruppati da un raccoglitore ed elaborati dal servizio di aggregazione, ai report di riepilogo risultanti viene aggiunto del rumore, ovvero una quantità casuale di dati. Il rumore viene aggiunto per proteggere la privacy degli utenti. L'obiettivo di questo meccanismo è avere un framework che possa supportare la misurazione con privacy differenziale.

Introduzione al rumore nei report di riepilogo
Sebbene l'aggiunta di rumore non sia in genere parte della misurazione degli annunci oggi, in molti casi il rumore aggiunto non cambierà sostanzialmente il modo in cui interpreti i risultati.
Potrebbe essere utile pensarci nel seguente modo: Prenderesti una decisione in base a un determinato dato se non fosse rumoroso?
Ad esempio, un inserzionista può essere certo di modificare la strategia o i budget della campagna in base al fatto che la campagna A ha generato 15 conversioni e la campagna B 16?
Se la risposta è no, il rumore è irrilevante.
Ti consigliamo di configurare l'utilizzo dell'API in modo che:
- La risposta alla domanda precedente è sì.
- Il rumore viene gestito in modo da non influire in modo significativo sulla tua capacità di prendere una decisione in base a determinati dati. Puoi procedere nel seguente modo: per un numero minimo di conversioni previsto, devi mantenere il rumore nella metrica raccolta al di sotto di una determinata percentuale.
In questa sezione e nelle successive, illustreremo le strategie per raggiungere il secondo obiettivo.
Concetti principali
Il servizio di aggregazione aggiunge rumore una volta a ogni valore di riepilogo, ovvero una volta per chiave, ogni volta che viene richiesto un report di riepilogo.
Questi valori di rumore vengono estratti in modo casuale da una distribuzione di probabilità specifica, descritta di seguito.
Tutti gli elementi che influiscono sul rumore si basano su due concetti principali.
La distribuzione del rumore (dettagli di seguito) è la stessa indipendentemente dal valore di riepilogo, basso o alto. Pertanto, maggiore è il valore di riepilogo, minore è l'impatto del rumore rispetto a questo valore.
Ad esempio, supponiamo che sia un valore di acquisto aggregato totale di 20.000 $sia un valore di acquisto aggregato totale di 200 $siano soggetti a rumore selezionato dalla stessa distribuzione.
Supponiamo che il rumore di questa distribuzione vari approssimativamente tra -100 e +100.
- Per il valore di acquisto complessivo di 20.000 $, il rumore varia tra 0 e 100/20.000=0,5%.
- Per il valore di acquisto complessivo di 200 $, il rumore varia tra 0 e 100/200=50%.
Pertanto, è probabile che il rumore abbia un impatto inferiore sul valore di acquisto aggregato di 20.000 $rispetto al valore di 200 $. In termini relativi, è probabile che 20.000 $ siano meno rumorosi, ovvero che abbiano un rapporto segnale/rumore più elevato.
Ciò ha alcune importanti implicazioni pratiche che sono descritte nella sezione successiva. Questo meccanismo fa parte del design dell'API e le implicazioni pratiche sono a lungo termine. Continueranno a svolgere un ruolo importante quando le tecnologie pubblicitarie progettano e valutano varie strategie di aggregazione.
Sebbene il rumore provenga dalla stessa distribuzione indipendentemente dal valore di riepilogo, questa distribuzione dipende da diversi parametri. Uno di questi parametri, epsilon, potrebbe essere modificato dalle tecnologie pubblicitarie durante la prova dell'origine conclusa per valutare vari aggiustamenti di utilità/privacy. Tuttavia, considera la possibilità di modificare epsilon come temporanea. Il tuo feedback sui casi d'uso e sui valori di epsilon che funzionano bene è sempre gradito.
Sebbene un'azienda di ad tech non abbia il controllo diretto sui modi in cui viene aggiunto il rumore, può influenzare l'impatto del rumore sui suoi dati di misurazione. Nelle sezioni successive, approfondiremo come il rumore può essere influenzato nella pratica.
Prima di farlo, diamo un'occhiata più da vicino al modo in cui viene applicato il rumore.
Zoom avanti: come viene applicato il rumore
Una distribuzione del rumore
Il rumore viene estratto dalla distribuzione di Laplace, con i seguenti parametri:
- Una media (
μ
) pari a 0. Ciò significa che il valore del rumore più probabile è 0 (nessun rumore aggiunto) e che il valore con rumore ha la stessa probabilità di essere inferiore all'originale o superiore (a volte viene chiamato non distorto). - Un parametro di scala pari a
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
è definito nel browser.epsilon
viene utilizzato nel servizio di aggregazione.
Il seguente diagramma mostra la funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20:

Valori di rumore casuale, una distribuzione del rumore
Supponiamo che una tecnologia pubblicitaria richieda report di riepilogo per due chiavi di aggregazione, chiave1 e chiave2.
Il servizio di aggregazione seleziona due valori di rumore x1 e x2, seguendo la stessa distribuzione del rumore. x1 viene aggiunto al valore di riepilogo per la chiave1 e x2 al valore di riepilogo per la chiave2.
Nei diagrammi, rappresenteremo i valori di rumore come identici. Si tratta di una semplificazione; in realtà, i valori del rumore variano, poiché vengono estratti in modo casuale dalla distribuzione.
Ciò dimostra che i valori del rumore provengono tutti dalla stessa distribuzione e sono indipendenti dal valore di riepilogo a cui vengono applicati.
Altre proprietà del rumore
Il rumore viene applicato a ogni valore di riepilogo, inclusi quelli vuoti (0).

Ad esempio, anche se il valore di riepilogo reale per una determinata chiave è 0, il valore di riepilogo con rumore visualizzato nel report di riepilogo per questa chiave (molto probabilmente) non sarà 0.
Il rumore può essere un numero positivo o negativo.

Ad esempio, per un importo di acquisto precedente al rumore pari a 327.000, il rumore può essere pari a +6.000 o -6.000 (si tratta di valori di esempio arbitrari).
Valutazione del rumore
Calcolo della deviazione standard del rumore
La deviazione standard del rumore è:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Esempio
Con epsilon = 10, la deviazione standard del rumore è:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Valutare quando le differenze di misurazione sono significative
Poiché conosci la deviazione standard del rumore aggiunto a ogni valore prodotto dal servizio di aggregazione, puoi determinare le soglie appropriate per il confronto per stabilire se le differenze osservate potrebbero essere dovute al rumore.
Ad esempio, se il rumore aggiunto a un valore è di circa +/- 10 (tenendo conto della scalabilità) e la differenza di valore tra due campagne è superiore a 100, è probabile che sia sicuro concludere che la differenza di valore misurata tra ogni campagna non è dovuta solo al rumore.
Interagisci e condividi il tuo feedback
Puoi partecipare e sperimentare con questa API.
- Scopri di più sui report aggregabili e sul servizio di aggregazione, fai domande e suggerisci feedback.
- Leggi le guide ai report sull'attribuzione.
- Fai domande e partecipa alle discussioni nel repository dell'assistenza per gli sviluppatori Privacy Sandbox.
Passaggi successivi
- Per scoprire quali variabili puoi controllare per migliorare il rapporto segnale/rumore, consulta Gestire il rumore.
- Consulta Eseguire esperimenti con le decisioni di progettazione dei report di riepilogo per ricevere assistenza per la pianificazione delle strategie di generazione di report di aggregazione.
- Prova il Noise Lab.