Lavorare con il rumore

Scopri come utilizzare, tenere conto e ridurre l'impatto del rumore nei report aggregabili.

Prima di iniziare

Prima di procedere, per comprendere meglio il rumore e il suo impatto, consulta Comprendere il rumore nei report di riepilogo.

I tuoi controlli per il rumore

Anche se non puoi controllare direttamente il rumore aggiunto ai report aggregabili, ci sono alcuni passaggi che puoi seguire per ridurne al minimo gli effetti. Le sezioni seguenti spiegano queste strategie.

Fai lo scale up fino al budget per il contributo

Come spiegato in Comprendere il rumore, il rumore applicato al valore di riepilogo per ogni chiave si basa sulla scala 0-65.536 (0-CONTRIBUTION_BUDGET).

La distribuzione del rumore si basa sul budget.

Per questo motivo, per massimizzare l'indicatore in relazione al rumore, devi scalare verso l'alto ogni valore prima di impostarlo come valore aggregabile, ovvero moltiplicare ciascun valore per un determinato fattore, il fattore di scalabilità, garantendo al contempo che rimanga entro il budget del contributo.

Rumore relativo con e senza scalabilità.

Calcolo di un fattore di scalabilità

Il fattore di scalabilità rappresenta quanto vuoi scalare un valore aggregabile. Il suo valore dovrebbe essere il budget per il contributo diviso per il valore massimo aggregabile per una determinata chiave.

Determinazione del fattore di scalabilità in base al budget per il contributo.

Ad esempio, supponiamo che gli inserzionisti vogliano conoscere il valore di acquisto totale. Sai che il valore di acquisto massimo previsto per ogni singolo acquisto è pari a 2000 €, fatta eccezione per alcuni valori anomali che decidi di ignorare:

  • Calcola il fattore di scalabilità:
    • Per massimizzare il rapporto segnale-rumore, devi scalare questo valore a 65.536 (budget per il contributo).
    • Ciò si traduce in un fattore di scalabilità di circa 32x pari a 65.536 / 2000. In pratica, puoi arrotondare questo fattore per eccesso o per difetto.
  • Fai lo scale up dei valori prima dell'aggregazione. Per ogni $1 di acquisto, incrementa la metrica monitorata di 32. Ad esempio, per un acquisto di 120$, imposta un valore aggregabile di 120*32 = 3840.
  • Fai lo scale down dei valori dopo l'aggregazione. Una volta ricevuto il report di riepilogo che contiene il valore di acquisto sommato per più utenti, fai lo scale down del valore di riepilogo utilizzando il fattore di scalabilità utilizzato prima dell'aggregazione. Nel nostro esempio, abbiamo utilizzato un fattore di scalabilità pari a 32 per la preaggregazione, quindi dobbiamo dividere per 32 il valore di riepilogo ricevuto nel report di riepilogo. Pertanto, se il valore di acquisto di riepilogo per una determinata chiave nel report di riepilogo è 76.800, il valore di acquisto di riepilogo (con rumore) è 76.800/32 = $2400.

Suddividi il budget

Se hai diversi obiettivi di misurazione, ad esempio conteggio degli acquisti e valore di acquisto, ti consigliamo di suddividere il budget tra questi obiettivi.

In questo caso, i fattori di scalabilità saranno diversi per diversi valori aggregabili, a seconda del massimo previsto di un valore aggregabile.

Per informazioni dettagliate, consulta la sezione Informazioni sulle chiavi di aggregazione.

Ad esempio, supponiamo che tu stia monitorando sia il conteggio degli acquisti sia il valore degli acquisti e che tu decida di allocare il budget equamente.

65.536 / 2 = 32.768 possono essere assegnati per tipo di misurazione e per origine.

  • Numero di acquisti:
    • Stai monitorando un solo acquisto, pertanto il numero massimo di acquisti per una determinata conversione è 1.
    • Pertanto, si decide di impostare il fattore di scala per il conteggio acquisti su 32.768 / 1 = 32.768.
  • Valore di acquisto:
    • Supponiamo che il valore di acquisto massimo previsto per ogni singolo acquisto sia pari a 2000 €.
    • Pertanto, si decide di impostare il fattore di scala per il valore di acquisto su 32.768 / 2.000 = 16,384 o circa 16.

Chiavi di aggregazione più approssimative migliorano il rapporto segnale-rumore

Poiché le chiavi generiche catturano più eventi di conversione rispetto alle chiavi granulari, in genere le chiavi generiche portano a valori di riepilogo più elevati.

I valori di riepilogo più elevati sono meno influenzati dal rumore rispetto ai valori più bassi; il rumore su questi valori è probabilmente più basso rispetto a questo valore.

È probabile che i valori raccolti con chiavi più generiche siano relativamente meno fragili rispetto ai valori raccolti con chiavi più granulari.

Esempio

Tutte le altre chiavi rimangono uguali: una chiave che monitora il valore di acquisto a livello globale (sommato in tutti i paesi) genera un valore di acquisto di riepilogo più elevato (e un numero di conversioni riepilogativo più elevato) rispetto a una chiave che monitora le conversioni a livello di paese.

Di conseguenza, il rumore relativo sul valore totale di acquisto di un paese specifico sarà superiore a quello sul valore di acquisto totale di tutti i paesi.

Analogamente, tutti i prodotti sono uguali: il valore totale di acquisto delle scarpe è inferiore al valore di acquisto totale di tutti gli articoli (incluse le scarpe).

Di conseguenza, il rumore relativo sul valore totale di acquisto per le scarpe sarà superiore a quello sul valore di acquisto totale di tutti gli articoli.

Impatto sul rumore con tasti granulari o approssimativi.

La somma dei valori di riepilogo (aggregazioni) somma anche il rumore

Sommando i valori di riepilogo dei report di riepilogo per accedere a dati di livello superiore, somma anche il rumore di questi valori.

Il grado di rumore con i tasti granulari con aggregazione rispetto ai tasti approssimativi senza aggregazione

Esaminiamo due diversi approcci: - Approccio A: includi un ID area geografica nelle tue chiavi. I report di riepilogo espongono le chiavi a livello di ID geografico, ciascuna associata al valore di acquisto di riepilogo a uno specifico livello di ID geografico. - Approccio B: non includi l'ID area geografica nelle chiavi. I report di riepilogo espongono direttamente il valore di acquisto di riepilogo per tutte le località / ID area geografica.

Per accedere al valore di acquisto a livello di paese: - Con l'approccio A, somma i valori di riepilogo a livello di ID geografico e di conseguenza anche il rumore. In questo modo è probabile che venga aggiunto altro rumore al valore di acquisto finale a livello di ID geografico. - Con l'approccio B, esamini direttamente i dati esposti nei report di riepilogo. Il rumore è stato aggiunto solo una volta a questi dati.

Di conseguenza, è probabile che il valore di acquisto di riepilogo per un determinato ID geografico sia più rumoroso con l'approccio A.

Analogamente, l'inclusione di una dimensione a livello di codice postale nelle chiavi potrebbe portare a risultati più "sporchi" rispetto all'uso di chiavi più approssimative con una dimensione a livello di regione.

L'aggregazione per periodi di tempo più lunghi aumenta il rapporto segnale-rumore

La richiesta di report di riepilogo con minore frequenza significa che ogni valore di riepilogo sarà probabilmente più elevato rispetto a quanto accadrebbe con maggiore frequenza rispetto alla richiesta di report di riepilogo. È probabile che si verifichino più conversioni in periodi di tempo più lunghi.

Come accennato in precedenza, più alto è il valore di riepilogo, più basso è probabilmente il rumore relativo. Di conseguenza, richiedere report di riepilogo meno frequentemente porta a un rapporto segnale/rumore più elevato (migliore).

La richiesta di report di riepilogo con minore frequenza porta a un rapporto segnale-rumore più elevato

Per spiegare meglio, ecco un esempio:

  • Se richiedi report di riepilogo orari su 24 ore e successivamente somma il valore di riepilogo di ogni report per accedere ai dati a livello di giorno, il rumore viene aggiunto 24 volte.
  • In un report di riepilogo giornaliero, il rumore viene aggiunto una sola volta.

Epsilon più alto, rumore più basso

Maggiore è il valore di epsilon, minori sono il rumore e la protezione della privacy.

Sfruttare filtri e deduplicazione

Una parte importante dell'allocazione del budget tra chiavi diverse è comprendere quante volte può verificarsi un determinato evento. Ad esempio, un inserzionista potrebbe essere interessato a un solo acquisto per ogni clic, ma potrebbe essere interessato a un massimo di 3 conversioni di tipo "visualizzazione di pagina del prodotto". Per supportare questi casi d'uso, ti consigliamo di sfruttare le seguenti funzionalità API che ti consentono di controllare quanti report vengono generati e quali conversioni vengono conteggiate:

Sperimentazione con Epsilon

Gli ad tech possono impostare epsilon su un valore maggiore di 0 e fino a 64 incluso. Questo intervallo consente test flessibili. Valori più bassi di epsilon offrono una maggiore protezione della privacy. Ti consigliamo di iniziare con epsilon=10.

Consigli per l'esperimento

Ti consigliamo di: - Iniziare con epsilon = 10. - Nel caso in cui questo causi problemi significativi all'utilità, aumentare epsilon in modo incrementale. - Condividi il tuo feedback su specifici punti di svolta che potresti trovare in merito all'usabilità dei dati.

Interagisci e condividi il tuo feedback

Puoi partecipare e sperimentare con questa API.

Passaggi successivi