Comprendere il rumore nei report di riepilogo

Scopri cosa significa il rumore, dove viene aggiunto e come influisce sulle tue iniziative di misurazione.

I report di riepilogo sono il risultato dell'aggregazione di report aggregabili. Quando i report aggregabili vengono raggruppati da un raccoglitore ed elaborati dal servizio di aggregazione, ai report di riepilogo risultanti viene aggiunto il rumore, una quantità casuale di dati. Viene aggiunto rumore per proteggere la privacy dell'utente. L'obiettivo di questo meccanismo è avere un framework in grado di supportare la misurazione diversamente privata.

Viene aggiunto del rumore nel report di riepilogo finale.

Introduzione al rumore nei report di riepilogo

Sebbene l'aggiunta di rumore non faccia parte della misurazione degli annunci al giorno d'oggi, in molti casi questo rumore non cambia in modo sostanziale il modo in cui interpreti i risultati.

Potrebbe essere utile pensare in questo modo: Ti sentiresti a tuo agio nel prendere una decisione basata su un determinato dato se i dati non fossero "rumorosi"?

Ad esempio, un inserzionista sarebbe sicuro di poter cambiare la strategia o i budget della sua campagna basandosi sul fatto che la Campagna A ha generato 15 conversioni e la Campagna B 16?

Se la risposta è no, il rumore non è pertinente.

Ti consigliamo di configurare l'utilizzo delle API in modo tale che:

  1. La risposta alla domanda precedente è sì.
  2. Il rumore viene gestito in un modo che non influisce in modo significativo sulla tua capacità di prendere una decisione in base a determinati dati. Puoi affrontare questo problema nel seguente modo: per un numero minimo previsto di conversioni, devi mantenere il rumore nella metrica raccolta al di sotto di una determinata percentuale.

In questa sezione e in quella successiva illustreremo le strategie per ottenerne 2.

Concetti principali

Il servizio di aggregazione aggiunge il rumore una volta a ogni valore di riepilogo, ovvero una volta per chiave, ogni volta che viene richiesto un report di riepilogo.

Questi valori di rumore vengono estratti in modo casuale da una distribuzione di probabilità specifica, discussa di seguito.

Tutti gli elementi che influiscono sul rumore si basano su due concetti principali.

  1. La distribuzione del rumore (dettagli di seguito) è la stessa indipendentemente dal valore del riassunto, basso o alto. Pertanto, più alto è il valore di riepilogo, minore sarà l'impatto che il rumore potrebbe avere rispetto a questo valore.

    Ad esempio, supponiamo che sia un valore di acquisto aggregato totale di 20.000 $che un valore di acquisto aggregato totale di 200 $siano soggetti al rumore selezionato dalla stessa distribuzione.

    Supponiamo che il rumore di questa distribuzione vari approssimativamente tra -100 e +100.

    • Per il valore di acquisto riepilogativo di 20.000 $, il rumore varia tra 0 e 100/20.000=0,5%.
    • Per il valore di acquisto riepilogativo di 200 $, il rumore varia tra 0 e 100/200=50%.

    Di conseguenza, è probabile che il rumore abbia un impatto inferiore sul valore di acquisto aggregato di 20.000 $rispetto a quello di 200 $. Relativamente di 20.000 $, è probabile che siano meno rumorosi, cioè con un rapporto segnale-rumore più alto.

    Valori aggregati più elevati hanno un impatto relativamente basso sul rumore.

    Questo comporta alcune importanti implicazioni pratiche descritte nella prossima sezione. Questo meccanismo fa parte della progettazione dell'API e le implicazioni pratiche sono a lungo termine. Continueranno a svolgere un ruolo importante nella progettazione e valutazione di varie strategie di aggregazione che gli ad tech.

  2. Sebbene il rumore venga estratto dalla stessa distribuzione indipendentemente dal valore di riepilogo, questa distribuzione dipende da diversi parametri. Uno di questi parametri, epsilon, potrebbe essere modificato dagli ad tech durante la prova dell'origine terminata per valutare vari aggiustamenti relativi a utilità/privacy. Tuttavia, considera la possibilità di modificare epsilon come temporaneo. Apprezziamo il vostro feedback sui vostri casi d'uso e sui valori di epsilon che funzionano bene.

Sebbene un'azienda di ad tech non abbia il controllo diretto delle modalità di aggiunta del rumore, può influenzare l'impatto del rumore sui suoi dati di misurazione. Nelle sezioni successive, vedremo in pratica come il rumore può essere influenzato.

Prima di farlo, diamo un'occhiata più da vicino al modo in cui viene applicato il rumore.

Aumentare lo zoom: come viene applicato il rumore

Una distribuzione del rumore

Il rumore viene estratto dalla distribuzione di Laplace, con i seguenti parametri:

  • Una media (μ) di 0. Ciò significa che il valore più probabile del rumore è 0 (nessun rumore aggiunto) e che il valore del rumore è tanto probabile che sia minore dell'originale, ma anche di dimensioni maggiori (talvolta chiamato imparziale).
  • Un parametro di scala pari a b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET è definito nel browser.
    • epsilon è stato corretto nel server di aggregazione.

Il seguente diagramma mostra la funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20:

Funzione di densità di probabilità per una distribuzione di Laplace con μ=0, b = 20

Valori di rumore casuali, una distribuzione del rumore

Supponiamo che una tecnologia pubblicitaria richieda report di riepilogo per due chiavi di aggregazione, chiave1 e chiave2.

Il servizio di aggregazione seleziona due valori di rumore x1 e x2, seguendo la stessa distribuzione del rumore. x1 viene aggiunto al valore di riepilogo per chiave1 e x2 viene aggiunto al valore di riepilogo per chiave2.

Nei diagrammi, rappresenteremo i valori del rumore come identici. Questa è una semplificazione; in realtà, i valori del rumore varieranno poiché vengono ricavati in modo casuale dalla distribuzione.

Questo dimostra che i valori del rumore provengono tutti dalla stessa distribuzione e sono indipendenti dal valore di riepilogo a cui vengono applicati.

Altre proprietà del rumore

Il rumore viene applicato a tutti i valori di riepilogo, inclusi quelli vuoti (0).

Anche i valori di riepilogo vuoti sono soggetti a rumore.

Ad esempio, anche se il vero valore di riepilogo di una determinata chiave è 0, il valore di riepilogo del rumore visualizzato nel report di riepilogo relativo a questa chiave sarà (molto probabilmente) diverso da 0.

Il rumore può essere un numero positivo o negativo.

Esempi di rumore positivo e negativo.

Ad esempio, per un acquisto pre-rumore di 327.000, il rumore può essere +6000 o -6000 (si tratta di valori di esempio arbitrari).

Valutazione del rumore

Calcolo della deviazione standard del rumore

La deviazione standard del rumore è:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Esempio

Con epsilon = 10, la deviazione standard del rumore è:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Valutazione dei casi in cui le differenze di misurazione sono significative

Poiché conosci la deviazione standard del rumore aggiunto a ciascun valore restituito dal servizio di aggregazione, puoi determinare le soglie appropriate per il confronto per determinare se le differenze osservate potrebbero essere dovute al rumore.

Ad esempio, se il rumore aggiunto a un valore è di circa +/- 10 (per riflettere il ridimensionamento) e la differenza nel valore tra due campagne è superiore a 100, è probabile che la differenza nel valore misurato tra ciascuna campagna sia dovuta al solo rumore.

Interagisci e condividi il tuo feedback

Puoi partecipare e sperimentare con questa API.

Passaggi successivi