Laboratorio rumore

Informazioni su questo documento

Leggendo questo articolo:

  • Prima di generare report di riepilogo, scopri quali strategie creare.
  • Impara a conoscere Noise Lab, uno strumento che consente di comprendere gli effetti di vari parametri del rumore e che consente di esplorare e valutare rapidamente varie strategie di gestione del rumore.
Screenshot di Noise Lab
Noise Lab

Condividi il tuo feedback

Sebbene questo documento riassuma alcuni principi per lavorare con i report di riepilogo, esistono diversi approcci alla gestione del rumore che potrebbero non essere riportati qui. I tuoi suggerimenti, aggiunte e domande sono ben accetti.

  • Per fornire un feedback pubblico sulle strategie di gestione del rumore, sull'utilità o sulla privacy dell'API (epsilon) e per condividere le tue osservazioni durante la simulazione con Noise Lab: Commenta questo problema
  • Per dare un feedback pubblico su Noise Lab (fai una domanda, segnala un bug, richiedi una funzionalità): Crea un nuovo problema qui
  • Per fornire un feedback pubblico su un altro aspetto dell'API: Crea un nuovo problema qui

Prima di iniziare

  1. Per un'introduzione, leggi gli articoli Report sull'attribuzione: report di riepilogo e Panoramica completa del sistema di Attribution Reporting.
  2. Analizza le sezioni Comprendere il rumore e Comprendere le chiavi di aggregazione per utilizzare al meglio questa guida.

Decisioni di progettazione

Principio di progettazione fondamentale

Esistono differenze fondamentali tra il funzionamento dei cookie di terze parti e dei report di riepilogo. Una differenza fondamentale è il rumore aggiunto ai dati di misurazione nei report di riepilogo. Un'altra è la modalità di pianificazione dei report.

Per accedere ai dati di misurazione dei report di riepilogo con rapporti segnale-rumore più elevati, le Demand-Side Platform (DSP) e i fornitori di servizi di misurazione degli annunci dovranno collaborare con i propri inserzionisti per sviluppare strategie di gestione del rumore. Per sviluppare queste strategie, le DSP e i fornitori di servizi di misurazione devono prendere decisioni di progettazione. Queste decisioni vertono su un concetto essenziale:

Sebbene i valori di rumore di distribuzione siano tratti, in realtà, dipendono solo da due parametri: epsilon e il budget per il contributo: hai a disposizione una serie di altri controlli che influiranno sul rapporto segnale-rumore dei tuoi dati di misurazione dell'output.

Ci aspettiamo che un processo iterativo porti alle decisioni migliori, ma ogni variazione di queste decisioni porterà a un'implementazione leggermente diversa, pertanto queste decisioni devono essere prese prima di scrivere ogni iterazione del codice (e prima di pubblicare gli annunci).

Decisione: granularità delle dimensioni

Prova in Noise Lab

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca I tuoi dati sulle conversioni.
  3. Osserva i parametri predefiniti. Per impostazione predefinita, il numero totale di conversioni giornaliere attribuibili è 1000. La media si aggira intorno a 40 per bucket se utilizzi la configurazione predefinita (dimensioni predefinite, numero predefinito di possibili valori diversi per ogni dimensione, strategia chiave A). Osserva che il valore è 40 nel conteggio delle conversioni giornaliere attribuibili medio per BUCKET.
  4. Fai clic su Simula per eseguire una simulazione con i parametri predefiniti.
  5. Nel riquadro laterale Parametri, cerca la voce Dimensioni. Rinomina Area geografica in Città e modifica il numero di possibili valori diversi in 50.
  6. Osserva come questo cambia il conteggio medio delle conversioni giornaliere attribuibili PER BUCKET. Ora è molto più basso. Il motivo è che se aumenti il numero di possibili valori all'interno di questa dimensione senza modificare altro, si aumenta il numero totale di bucket senza modificare il numero di eventi di conversione che rientrano in ogni bucket.
  7. Fai clic su Simula.
  8. Osserva i rapporti di rumore della simulazione risultante: i rapporti di rumore sono ora più elevati rispetto alla simulazione precedente.

Dato il principio di progettazione di base, è probabile che i valori di riepilogo piccoli siano più "rumorosi" rispetto ai valori di riepilogo di grandi dimensioni. Di conseguenza, la scelta della configurazione influisce sul numero di eventi di conversione attribuiti che finiscono in ciascun bucket (altrimenti noto come chiave di aggregazione) e la quantità influisce sul rumore nei report di riepilogo degli output finali.

Una decisione di progettazione che influisce sul numero di eventi di conversione attribuiti in un singolo bucket è la granularità delle dimensioni. Considera i seguenti esempi di chiavi di aggregazione e le loro dimensioni:

  • Metodo 1: una struttura chiave con dimensioni approssimative: Paese x Campagna pubblicitaria (o il bucket di aggregazione di campagne più grande) x Tipo di prodotto (tra 10 tipi di prodotto possibili).
  • Approccio 2: una struttura chiave con dimensioni granulari: Città x ID creatività x Prodotto (su 100 prodotti possibili).

Città è una dimensione più granulare rispetto a Paese; ID creatività è più granulare di Campagna e Prodotto è più granulare di Tipo di prodotto. Pertanto, l'approccio 2 avrà un numero di eventi (conversioni) per bucket (= per chiave) inferiore nell'output del report di riepilogo rispetto all'approccio 1. Dato che il rumore aggiunto all'output è indipendente dal numero di eventi nel bucket, i dati di misurazione nei report di riepilogo saranno più fastidiosi con l'approccio 2. Per ogni inserzionista, sperimenta vari compromessi in termini di granularità nel design della chiave al fine di ottenere la massima utilità nei risultati.

Decisione: strutture chiave

Prova in Noise Lab

Nella modalità semplice viene utilizzata la struttura di chiavi predefinita. Nella modalità Avanzata, puoi provare diverse strutture di chiavi. Sono incluse alcune dimensioni di esempio che puoi modificare.

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca Strategia chiave. Osserva che la strategia predefinita, denominata A nello strumento, utilizza una struttura chiave granulare che include tutte le dimensioni: Area geografica x ID campagna x Categoria di prodotto.
  3. Fai clic su Simula.
  4. Osserva i rapporti di rumore della simulazione risultante.
  5. Cambia la strategia chiave in B. In questo modo vengono visualizzati controlli aggiuntivi per configurare la struttura delle chiavi.
  6. Configura la struttura delle chiavi, ad esempio come segue:
    1. Numero di strutture chiave: 2
    2. Struttura chiave 1 = Area geografica x Categoria di prodotto.
    3. Struttura della chiave 2 = ID campagna x Categoria di prodotto.
  7. Fai clic su Simula.
  8. Tieni presente che ora riceverai due report di riepilogo per tipo di obiettivo di misurazione (due per il conteggio degli acquisti, due per il valore di acquisto), dato che utilizzi due strutture chiave distinte. Osservare i rapporti di rumore.
  9. Puoi anche provare a usare le dimensioni personalizzate. A questo scopo, cerca Dati che vuoi monitorare: Dimensioni. Valuta la possibilità di rimuovere le dimensioni di esempio e di crearne di nuove utilizzando i pulsanti Aggiungi/Rimuovi/Reimposta sotto l'ultima dimensione.

Un'altra decisione di progettazione che influisce sul numero di eventi di conversione attribuiti all'interno di un singolo bucket sono le strutture chiave che decidi di utilizzare. Considera i seguenti esempi di chiavi di aggregazione:

  • Una struttura chiave con tutte le dimensioni, che chiamiamo questa strategia chiave A.
  • Due strutture chiave, ciascuna con un sottoinsieme di dimensioni, che chiamiamo questa strategia chiave B.
Diagramma:

La strategia A è più semplice, ma potrebbe essere necessario aggregare (somma) i valori di riepilogo inclusi nei report di riepilogo per accedere a determinate informazioni. Sommando questi valori, stai sommando anche il rumore. Con la strategia B, i valori di riepilogo esposti nei report di riepilogo potrebbero già fornirti le informazioni necessarie. Ciò significa che probabilmente la strategia B migliorerà il rapporto segnale-rumore rispetto alla strategia A. Tuttavia, il rumore potrebbe essere già accettabile con la strategia A, quindi potresti decidere di preferire la strategia A per semplicità. Scopri di più nell'esempio dettagliato che illustra queste due strategie.

La gestione delle chiavi è un argomento importante. Per migliorare il rapporto segnale-rumore, si può prendere in considerazione una serie di tecniche elaborate. Uno è descritto in Gestione avanzata delle chiavi.

Decisione: frequenza di raggruppamento

Prova in Noise Lab

  1. Passa alla Modalità semplice (o alla modalità Avanzata, entrambe le modalità funzionano allo stesso modo per quanto riguarda la frequenza di raggruppamento)
  2. Nel riquadro laterale Parametri, cerca Strategia di aggregazione > Frequenza di raggruppamento. Si riferisce alla frequenza di raggruppamento dei report aggregabili che vengono elaborati con il servizio di aggregazione in un singolo job.
  3. Osserva la frequenza di raggruppamento predefinita: per impostazione predefinita, viene simulata una frequenza di raggruppamento giornaliera.
  4. Fai clic su Simula.
  5. Osserva i rapporti di rumore della simulazione risultante.
  6. Imposta la frequenza di raggruppamento in settimanale.
  7. Osserva i rapporti di rumore della simulazione risultante: i rapporti di rumore sono ora inferiori (migliori) rispetto alla simulazione precedente.

Un'altra decisione di progettazione che influisce sul numero di eventi di conversione attribuiti all'interno di un singolo bucket è la frequenza di raggruppamento che decidi di utilizzare. La frequenza del batch indica la frequenza con cui elabori i report aggregabili.

Un report per cui l'aggregazione è pianificata con maggiore frequenza (ad es. ogni ora) includerà meno eventi di conversione rispetto allo stesso report con una pianificazione di aggregazione meno frequente (ad es. ogni settimana). Di conseguenza, il report orario includerà più rumore. Con "meno eventi di conversione" sono inclusi meno eventi di conversione rispetto allo stesso report con una pianificazione di aggregazione meno frequente (ad es. ogni settimana). Di conseguenza, il report orario avrà un rapporto segnale-rumore più basso rispetto al report settimanale, con tutti gli altri valori uguali. Fai esperimenti con i requisiti di generazione dei report con diverse frequenze e valuta i rapporti segnale-rumore per ciascuna.

Scopri di più nelle sezioni Batch e Aggregazione in periodi di tempo più lunghi.

Decisione: variabili di campagna che influiscono sulle conversioni attribuibili

Prova in Noise Lab

Sebbene possa essere difficile da prevedere e possa presentare variazioni significative oltre agli effetti stagionali, prova a stimare il numero di conversioni singolarmente attribuibili giornaliere utilizzando il valore più prossimo di 10: 10, 100, 1000 o 10.000.

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca I tuoi dati sulle conversioni.
  3. Osserva i parametri predefiniti. Per impostazione predefinita, il numero totale di conversioni giornaliere attribuibili è 1000. La media si aggira intorno a 40 per bucket se utilizzi la configurazione predefinita (dimensioni predefinite, numero predefinito di possibili valori diversi per ogni dimensione, strategia chiave A). Osserva che il valore è 40 nel conteggio delle conversioni giornaliere attribuibili medio per BUCKET.
  4. Fai clic su Simula per eseguire una simulazione con i parametri predefiniti.
  5. Osserva i rapporti di rumore della simulazione risultante.
  6. Ora imposta il numero totale di conversioni giornaliere attribuibili su 100. Tieni presente che ciò riduce il valore del conteggio delle conversioni medio giornaliero attribuibile PER BUCKET.
  7. Fai clic su Simula.
  8. Osserva che i rapporti di rumore sono ora più elevati: questo perché quando hai meno conversioni per bucket, viene applicato più rumore per mantenere la privacy.

Una distinzione importante è il numero totale di possibili conversioni per un inserzionista rispetto al numero totale di possibili conversioni attribuite. Il secondo è l'aspetto in definitiva che influisce sul rumore nei report di riepilogo. Le conversioni attribuite sono un sottoinsieme di conversioni totali soggette alle variabili della campagna, come il budget pubblicitario e il targeting degli annunci. Ad esempio, ti aspetteresti un numero più elevato di conversioni attribuite per una campagna pubblicitaria da 10.000 € rispetto a una campagna pubblicitaria da 10.000 €, a parità di condizioni.

Tieni presente quanto segue:

  • Valutare le conversioni attribuite in base a un modello di attribuzione single-touch dello stesso dispositivo, poiché rientrano nell'ambito dei report di riepilogo raccolti con l'API Attribution Reporting.
  • Considera sia un conteggio dello scenario peggiore sia uno dei conteggi dello scenario migliore per le conversioni attribuite. Ad esempio, a parità di condizioni, considera i budget minimi e massimi possibili delle campagne per un inserzionista, quindi prevedi le conversioni attribuibili per entrambi i risultati come input nella simulazione.
  • Se stai prendendo in considerazione l'utilizzo di Privacy Sandbox di Android, prendi in considerazione le conversioni attribuite a più piattaforme nel calcolo.

Decisione: utilizzare la scalabilità

Prova in Noise Lab

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca la tua strategia di aggregazione > Scalabilità. L'opzione predefinita è Sì.
  3. Per comprendere gli effetti positivi della scalabilità sul rapporto di rumore, imposta innanzitutto la scalabilità su No.
  4. Fai clic su Simula.
  5. Osserva i rapporti di rumore della simulazione risultante.
  6. Imposta Scalabilità su Sì. Tieni presente che Noise Lab calcola automaticamente i fattori di scalabilità da utilizzare sulla base degli intervalli (valori medi e massimi) degli obiettivi di misurazione per il tuo scenario. In una configurazione reale del sistema o della prova dell'origine, ti consigliamo di implementare il tuo calcolo per i fattori di scalabilità.
  7. Fai clic su Simula.
  8. Osserva che i rapporti di rumore sono ora più bassi (migliori) in questa seconda simulazione. Il motivo è che utilizzi la scalabilità.

Dato il principio di progettazione di base, il rumore aggiunto è una funzione del budget per il contributo.

Di conseguenza, per aumentare i rapporti indicatore-rumore, puoi decidere di trasformare i valori raccolti durante un evento di conversione ridimensionandoli in base al budget del contributo (e ridimensionandoli dopo l'aggregazione). Usa la scalabilità per aumentare i rapporti segnale-rumore.

Decisione: numero di obiettivi di misurazione e suddivisione del budget per la privacy

Questo riguarda la scalabilità. Assicurati di leggere Utilizzo della scalabilità.

Prova in Noise Lab

Un obiettivo di misurazione è un punto dati distinto raccolto negli eventi di conversione.

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca i dati che vuoi monitorare: obiettivi di misurazione. Per impostazione predefinita, hai due obiettivi di misurazione: valore di acquisto e conteggio acquisti.
  3. Fai clic su Simula per eseguire una simulazione con gli obiettivi predefiniti.
  4. Fai clic su Rimuovi. Verrà rimosso l'ultimo obiettivo di misurazione (in questo caso, il conteggio degli acquisti).
  5. Fai clic su Simula.
  6. Osserva che i rapporti di rumore per il valore di acquisto sono ora più bassi (migliori) per questa seconda simulazione. Il motivo è che hai meno obiettivi di misurazione, pertanto il tuo unico obiettivo di misurazione ora riceve tutto il budget per il contributo.
  7. Fai clic su Reimposta. Ora hai di nuovo due obiettivi di misurazione: valore dell'acquisto e conteggio acquisti. Tieni presente che Noise Lab calcola automaticamente i fattori di scalabilità da utilizzare sulla base degli intervalli (valori medi e massimi) degli obiettivi di misurazione per il tuo scenario. Per impostazione predefinita, Noise Lab suddivide il budget equamente tra gli obiettivi di misurazione.
  8. Fai clic su Simula.
  9. Osserva i rapporti di rumore della simulazione risultante. Prendi nota dei fattori di scalabilità visualizzati nella simulazione.
  10. Ora personalizziamo la suddivisione del budget per la privacy per ottenere un rapporto segnale-rumore migliore.
  11. Modificare la % di budget assegnata a ogni obiettivo di misurazione. Dati i parametri predefiniti, l'obiettivo di misurazione 1, ovvero il valore di acquisto, ha un intervallo molto più ampio (compreso tra 0 e 1000) rispetto all'obiettivo di misurazione 2, ovvero il conteggio degli acquisti (tra 1 e 1, ovvero sempre uguale a 1). Per questo motivo, ha bisogno di "più spazio per scalare": sarebbe ideale assegnare un budget di contributo maggiore all'obiettivo di misurazione 1 rispetto all'obiettivo di misurazione 2, in modo da fare lo scale up in modo più efficiente (vedi Scalabilità).
  12. Assegna il 70% del budget all'obiettivo di misurazione 1. Assegna il 30% all'obiettivo di misurazione 2.
  13. Fai clic su Simula.
  14. Osserva i rapporti di rumore della simulazione risultante. Per quanto riguarda il valore di acquisto, i rapporti di rumore sono ora notevolmente inferiori (migliori) rispetto alla simulazione precedente. Per quanto riguarda il numero di acquisti, i valori sono pressoché invariati.
  15. Continua a modificare la suddivisione del budget tra le metriche. Osserva l'impatto di questo cambiamento sul rumore.

Tieni presente che puoi impostare obiettivi di misurazione personalizzati con i pulsanti Aggiungi/Rimuovi/Reimposta.


Se misuri un punto dati (obiettivo di misurazione) su un evento di conversione, ad esempio il conteggio delle conversioni, quel punto dati può ricevere tutto il budget per il contributo (65536). Se imposti più obiettivi di misurazione su un evento di conversione, ad esempio conteggio delle conversioni e valore di acquisto, questi punti dati dovranno condividere il budget per il contributo. Ciò significa che hai meno margine per scalare i tuoi valori.

Pertanto, maggiore è il numero di obiettivi di misurazione, maggiori sono le probabilità che il rapporto segnale/rumore sia più basso (disturbo maggiore).

Un'altra decisione da prendere in merito agli obiettivi di misurazione è la suddivisione del budget. Se suddividi equamente il budget per il contributo tra due punti dati, ogni punto dati riceve un budget di 65536/2 = 32768. Questo può essere o non essere ottimale a seconda del valore massimo possibile per ciascun punto dati. Ad esempio, se stai misurando un numero di acquisti che ha un valore massimo pari a 1 e un valore di acquisto con un valore minimo compreso tra 1 e massimo 120, il valore di acquisto trarrebbe vantaggio da avere "più spazio" per lo scale up, ovvero da una quota maggiore del budget per il contributo. Vedrai se alcuni obiettivi di misurazione devono avere la priorità rispetto ad altri in relazione all'impatto del rumore.

Decisione: gestione outlier

Prova in Noise Lab

Un obiettivo di misurazione è un punto dati distinto raccolto negli eventi di conversione.

  1. Vai alla modalità Avanzata.
  2. Nel riquadro laterale Parametri, cerca la tua strategia di aggregazione > Scalabilità.
  3. Assicurati che la scalabilità sia impostata su Sì. Tieni presente che Noise Lab calcola automaticamente i fattori di scalabilità da utilizzare in base agli intervalli (valori medi e massimi) indicati per gli obiettivi di misurazione.
  4. Supponiamo che l'acquisto più grande mai effettuato sia stato di 2000 $, ma che la maggior parte degli acquisti avvenga tra i 10 e i 120 $. Innanzitutto, vediamo cosa succede se utilizziamo un approccio di scalabilità letterale (sconsigliato): inserisci $2000 come valore massimo per purchaseValue.
  5. Fai clic su Simula.
  6. Osserva che i rapporti di rumore sono elevati. Questo perché il nostro fattore di scalabilità è attualmente calcolato in base a 2000 $, quando in realtà la maggior parte dei valori di acquisto sarà notevolmente inferiore.
  7. Ora usiamo un approccio di scalabilità più pragmatico. Modifica il valore massimo di acquisto impostandolo su 120 $.
  8. Fai clic su Simula.
  9. Osserva che i rapporti di rumore sono più bassi (migliori) in questa seconda simulazione.

Per implementare la scalabilità, in genere viene calcolato un fattore di scalabilità basato sul valore massimo possibile per un determinato evento di conversione (scopri di più in questo esempio).

Tuttavia, evita di utilizzare un valore massimo letterale per calcolare questo fattore di scalabilità, poiché ciò peggiora i rapporti segnale-rumore. Rimuovi i valori anomali e utilizza un valore massimo pragmatico.

La gestione delle anomalie è un argomento importante. Per migliorare il rapporto segnale-rumore, si può prendere in considerazione una serie di tecniche elaborate. Uno è descritto in Gestione avanzata degli outlier.

Passaggi successivi

Ora che hai valutato varie strategie di gestione del rumore per il tuo caso d'uso, puoi iniziare a sperimentare con i report di riepilogo raccogliendo dati di misurazione reali tramite una prova dell'origine. Consulta le guide e i suggerimenti per provare l'API.

Appendice

Tour rapido di Noise Lab

Noise Lab consente di valutare e confrontare rapidamente le strategie di gestione del rumore. Utilizzala per:

  • Comprendi i parametri principali che possono influire sul rumore e gli effetti che producono.
  • Simula l'effetto del rumore sui dati di misurazione dell'output sulla base di diverse decisioni di progettazione. Modifica i parametri di progettazione fino a raggiungere un rapporto segnale-rumore adatto al tuo caso d'uso.
  • Condividi il tuo feedback sull'utilità dei report di riepilogo: quali valori dei parametri epsilon e del rumore funzionano per te e quali no? Dove si trovano i punti di curvatura?

È una fase di preparazione. Noise Lab genera dati di misurazione per simulare l'output dei report di riepilogo in base al tuo input. Non memorizza né condivide alcun dato.

Esistono due diverse modalità in Noise Lab:

  1. Modalità semplice: comprendi le nozioni di base dei controlli disponibili per il rumore.
  2. Modalità avanzata: testa diverse strategie di gestione del rumore e valuta quale genera i migliori rapporti segnale-rumore per i tuoi casi d'uso.

Fai clic sui pulsanti nel menu in alto per passare da una modalità all'altra (n. 1 nello screenshot in basso).

Modalità semplice
  • Con la modalità semplice, puoi controllare i Parametri (che si trovano sul lato sinistro o n. 2 nello screenshot di seguito) come Epsilon e vedere come influiscono sul rumore.
  • Ogni parametro ha una descrizione comando (un pulsante "?"). Fai clic per visualizzare una spiegazione di ciascun parametro (n. 3. nello screenshot di seguito).
  • Per iniziare, fai clic sul pulsante "Simula" e osserva l'aspetto dell'output (#4. nello screenshot di seguito)
  • Nella sezione Output puoi vedere diversi dettagli. Accanto ad alcuni elementi è presente un carattere "?". Fai clic su ogni "?" per visualizzare una spiegazione delle varie informazioni.
  • Nella sezione Output, fai clic sul pulsante di attivazione/disattivazione Dettagli se vuoi visualizzare una versione espansa della tabella (#5. nello screenshot di seguito).
  • Sotto ogni tabella di dati, nella sezione di output, è presente un'opzione per scaricarla per l'utilizzo offline. Inoltre, nell'angolo in basso a destra è presente un'opzione per scaricare tutte le tabelle di dati (n. 6. nello screenshot di seguito).
  • Prova diverse impostazioni per i parametri nella sezione Parametri e fai clic su Simula per vedere come influiscono sull'output:
    Rumore
    Interfaccia di Noise Lab per la modalità semplice.
Modalità avanzata
  • In modalità Avanzata, hai un maggiore controllo sui parametri. Puoi aggiungere dimensioni e obiettivi di misurazione personalizzati (n. 1 e n. 2 nello screenshot di seguito).
  • Scorri più in basso nella sezione Parametri e visualizza l'opzione Strategia chiave. Può essere utilizzata per testare diverse strutture di chiavi (n. 3. nello screenshot di seguito)
    • Per testare strutture chiave diverse, imposta la strategia chiave su "B"
    • Inserisci il numero di diverse strutture di chiavi che vuoi utilizzare (il valore predefinito è "2")
    • Fai clic su Genera strutture chiave
    • Visualizzerai le opzioni per specificare le strutture di chiavi facendo clic sulle caselle di controllo accanto alle chiavi da includere per ogni struttura di chiavi
    • Fai clic su Simula per visualizzare l'output.
      La modalità avanzata offre controlli per gli obiettivi di misurazione e le dimensioni da monitorare, evidenziati nella barra laterale.
      Interfaccia di Noise Lab per la modalità avanzata.
      La modalità Avanzata è anche un'opzione della strategia chiave nella sezione Parametri della barra laterale.
      Interfaccia di Noise Lab per la modalità avanzata.

Metriche relative al rumore

Concetto principale

Viene aggiunto del rumore per proteggere la privacy dei singoli utenti.

Un valore di rumore elevato indica che i bucket/le chiavi sono sparsi e contengono contributi da un numero limitato di eventi sensibili. Ciò viene eseguito automaticamente da Noise Lab, per consentire alle persone di "nascondersi nella folla" o, in altre parole, proteggere la privacy di queste persone limitate con una maggiore quantità di rumore in più.

Un valore basso di rumore indica che la configurazione dei dati è stata progettata in modo da consentire già alle persone di "nascondersi nella folla". Ciò significa che i bucket contengono contributi da un numero sufficiente di eventi per garantire che la privacy dei singoli utenti sia protetta.

Questa affermazione è vera sia per l'errore percentuale medio (APE) che per RMSRE_T (errore relativo quadratico medio con una soglia).

APE (errore percentuale medio)

L'APE è il rapporto tra il rumore sul segnale, ovvero il vero valore di riepilogo.p> Valori APE più bassi significano migliori rapporti segnale-rumore.

Formula

Per un determinato report di riepilogo, l'APE viene calcolato come segue:

L'equazione per l'APE. Sono obbligatori valori assoluti, poiché il rumore può essere negativo.

True è il valore di riepilogo reale. APE è la media del rumore in ogni valore di riepilogo reale, calcolata in media per tutte le voci di un report di riepilogo. In Noise Lab, questo valore viene quindi moltiplicato per 100 per ottenere una percentuale.

Pro e contro

I bucket con dimensioni più piccole hanno un impatto sproporzionato sul valore finale dell'APE. Questo potrebbe essere fuorviante durante la valutazione del rumore. Per questo motivo abbiamo aggiunto un'altra metrica, RMSRE_T, progettata per mitigare questo limite di APE. Per informazioni dettagliate, esamina gli esempi.

Codice

Esamina il codice sorgente per il calcolo dell'APE.

RMSRE_T (errore relativo al quadrato medio della radice con una soglia)

RMSRE_T (errore relativo alla radice del quadrato medio con una soglia) è un'altra misura del rumore.

Come interpretare RMSRE_T

Valori RMSRE_T più bassi significano migliori rapporti segnale-rumore.
Ad esempio, se un rapporto di rumore accettabile per il tuo caso d'uso è del 20% e RMSRE_T è 0,2, puoi avere la certezza che i livelli di rumore rientrino nell'intervallo accettabile.

Formula

Per un determinato report di riepilogo, RMSRE_T viene calcolato come segue:

Formula
L'equazione per RMSRE_T. Sono obbligatori valori assoluti, poiché il rumore può essere negativo.
Pro e contro

RMSRE_T è un po' più complesso da comprendere rispetto all'APE. Tuttavia, presenta alcuni vantaggi che lo rendono in alcuni casi più adatto rispetto all'APE per l'analisi del rumore nei report di riepilogo:

  • RMSRE_T è più stabile. "T" è una soglia. "T" viene utilizzato per attribuire meno peso nel calcolo RMSRE_T ai bucket che hanno meno conversioni e che sono quindi più sensibili al rumore grazie alle loro dimensioni ridotte. Con T, la metrica non registra un picco nei bucket con poche conversioni. Se T è uguale a 5, un valore di rumore inferiore a 1 in un bucket con 0 conversioni non verrà visualizzato come valore superiore a 1. Sarà invece limitato a 0, 2, che equivale a 1/5, poiché T è uguale a 5. Assegnando un peso minore ai bucket più piccoli, quindi più sensibili al rumore, questa metrica è più stabile e, di conseguenza, semplifica il confronto di due simulazioni.
  • RMSRE_T consente una facile aggregazione. Conoscere il valore RMSRE_T di più bucket e i relativi conteggi reali consente di calcolare l'RMSRE_T della somma. In questo modo puoi anche ottimizzare per RMSRE_T per questi valori combinati.

Sebbene l'aggregazione sia possibile per l'APE, la formula è piuttosto complicata in quanto comporta il valore assoluto della somma dei rumori di Laplace. Questo rende l'APE più difficile da ottimizzare.

Codice

Esamina il codice sorgente per il calcolo di RMSRE_T.

Esempi

Report di riepilogo con tre bucket:

  • bucket_1 = rumore: 10, trueRiepilogoValue: 100
  • bucket_2 = rumore: 20, trueRiepilogoValue: 100
  • bucket_3 = rumore: 20, trueRiepilogoValue: 200

APE = (0,1 + 0,2 + 0,1) / 3 = 13%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,200))^2) / 3) =  sqrt( (0.01 + 0.04 + 0.01) / 3) =  0.14 

Report di riepilogo con tre bucket:

  • bucket_1 = rumore: 10, trueRiepilogoValue: 100
  • bucket_2 = rumore: 20, trueRiepilogoValue: 100
  • bucket_3 = rumore: 20, trueRiepilogoValue: 20

APE = (0,1 + 0,2 + 1) / 3 = 43%

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2 +
(20/max(5,20))^2) / 3)  =  sqrt( (0.01 + 0.04 + 1.0) / 3) =  0.59

Report di riepilogo con tre bucket:

  • bucket_1 = rumore: 10, trueRiepilogoValue: 100
  • bucket_2 = rumore: 20, trueRiepilogoValue: 100
  • bucket_3 = rumore: 20, trueSummaryValue: 0

APE = (0,1 + 0,2 + Infinito) / 3 = Infinito

RMSRE_T = sqrt( ( (10/max(5,100))^2  + (20/max(5,100))^2  +
(20/max(5,0))^2) / 3) =  sqrt( (0.01 + 0.04 + 16.0) / 3) =  2.31

Gestione delle chiavi avanzata

Una piattaforma DSP o una società di misurazione degli annunci potrebbe avere migliaia di clienti pubblicitari globali, distribuiti in vari settori, valute e potenziali di prezzo di acquisto. Ciò significa che la creazione e la gestione di una chiave di aggregazione per inserzionista probabilmente non saranno molto pratiche. Inoltre, sarà sfidato a selezionare un valore massimo aggregabile e un budget di aggregazione che possa limitare l'impatto del rumore tra queste migliaia di inserzionisti globali. Consideriamo invece i seguenti scenari:

Strategia chiave A

Il fornitore di tecnologia pubblicitaria decide di creare e gestire una chiave per tutti i suoi clienti pubblicitari. In tutti gli inserzionisti e in tutte le valute, la gamma di acquisti varia da acquisti di basso volume e di fascia alta a acquisti di volumi elevati e di fascia bassa. Ciò porta alla seguente chiave:

Chiave (più valute)
Valore aggregabile massimo 5.000.000
Intervallo di valori di acquisto [120-5.000.000]
Strategia chiave B

Il fornitore di tecnologia pubblicitaria decide di creare e gestire due chiavi per tutti i suoi clienti pubblicitari. Decide di separare le chiavi in base alla valuta. In tutti gli inserzionisti e in tutte le valute, la gamma di acquisti varia da acquisti di basso volume, acquisti di fascia alta a acquisti di volumi elevati e di fascia bassa. Separando i dati per valuta, creano due chiavi:

Chiave 1 (USD) Tasto 2 (¥)
Valore aggregabile massimo $ 40.000 5.000.000 ¥
Intervallo di valori di acquisto [120-40.000] [15.000 - 5.000.000]

La strategia chiave B avrà meno rumore nei risultati rispetto alla strategia chiave A, perché i valori delle valute non sono distribuiti uniformemente tra le valute. Ad esempio, valuta come gli acquisti denominati in ¥ insieme agli acquisti denominati in USD modificheranno i dati sottostanti e il conseguente output disomogeneo.

Strategia chiave C

Il fornitore di ad tech decide di creare e gestire quattro chiavi in tutti i suoi clienti pubblicitari e di separarle per valuta x settore inserzionista:

Chiave 1
(USD x inserzionisti di gioielli di fascia alta)
Chiave 2
(¥ x inserzionisti di gioielli di fascia alta)
Chiave 3
(USD x inserzionisti di rivenditori di abbigliamento)
Chiave 4
(¥ x inserzionisti di rivenditori di abbigliamento)
Valore aggregabile massimo $ 40.000 5.000.000 ¥ 500 $ 65.000 ¥
Intervallo di valori di acquisto [10.000 - 40.000] [1.250.000 - 5.000.000] [120 - 500] [15.000 - 65.000]

La strategia chiave C avrà meno rumore nei risultati rispetto alla strategia chiave B, perché i valori di acquisto degli inserzionisti non sono distribuiti uniformemente tra gli inserzionisti. Ad esempio, considera come l'acquisto di gioielli di fascia alta insieme agli acquisti di cappelli da baseball altererà i dati sottostanti e il conseguente output disomogeneo.

Valuta la possibilità di creare valori aggregati massimi condivisi e fattori di scalabilità condivisi per le cose in comune tra più inserzionisti al fine di ridurre il rumore nell'output. Ad esempio, potresti sperimentare diverse strategie per i tuoi inserzionisti:

  • Una strategia separata per valuta (USD, ¥, CAD e così via).
  • Una strategia separata per settore dell'inserzionista (assicurazione, auto, vendita al dettaglio ecc.)
  • Una strategia separata da intervalli di valori di acquisto simili ([100], [1000], [10000] e così via)

Creando strategie chiave per condividere le caratteristiche degli inserzionisti, le chiavi e il codice corrispondente sono più facili da gestire e i rapporti segnale-rumore diventano più elevati. Sperimenta strategie diverse con caratteristiche comuni di diversi inserzionisti per scoprire i punti di svolta nella massimizzazione dell'impatto del rumore rispetto alla gestione del codice.


Gestione avanzata degli outlier

Esaminiamo uno scenario tra due inserzionisti:

  • Inserzionista A:
    • Per tutti i prodotti sul sito dell'inserzionista A, le possibilità di prezzo di acquisto sono comprese tra [$120 - $1000] , per un intervallo di $880.
    • I prezzi di acquisto sono distribuiti uniformemente nell'intervallo di 880 $, senza eccezioni al di fuori di due deviazioni standard dal prezzo di acquisto medio.
  • Inserzionista B:
    • Per tutti i prodotti sul sito dell'inserzionista B, le possibilità di prezzo di acquisto sono comprese tra [$120 - $1.000] , per un intervallo di $880.
    • I prezzi di acquisto sono fortemente inclinati verso l'intervallo di 120-500 $, con solo il 5% degli acquisti in un intervallo tra 500 e 1000 $.

Dati i requisiti del budget per il contributo e la metodologia con cui [viene applicato il rumore](/privacy-sandbox/relevance/attribution-reporting/understanding-noise/#how-noise-is-applied) ai risultati finali, l'Inserzionista B avrà, per impostazione predefinita, un output più rumoroso rispetto all'Inserzionista A, in quanto ha un maggiore potenziale che i valori anomali influiscano sui calcoli sottostanti.

È possibile mitigare questo problema con una configurazione della chiave specifica. Testare le strategie chiave che aiutano a gestire i dati anomali e a distribuire in modo più uniforme i valori di acquisto nell'intervallo di acquisto della chiave.

Per l'inserzionista B, puoi creare due chiavi separate per acquisire due diversi intervalli di valori di acquisto. In questo esempio, l'ad tech ha notato che i valori anomali sono superiori al valore di acquisto di 500 €. Prova a implementare due chiavi separate per questo inserzionista:

  • Struttura della chiave 1 : chiave che acquisisce solo acquisti compresi tra 120 $e 500 $ (coprendo circa il 95% del volume totale di acquisti).
  • Struttura della chiave 2: chiave che acquisisce solo acquisti superiori a 500 $ (coprendo circa il 5% del volume di acquisti totale).

L'implementazione di questa strategia chiave dovrebbe gestire meglio il rumore per l'inserzionista B e contribuire a massimizzare l'utilità dei report di riepilogo. Dati i nuovi intervalli più piccoli, la chiave A e la chiave B ora dovrebbero avere una distribuzione più uniforme dei dati in ogni rispettiva chiave rispetto alla precedente chiave singola. Ciò comporterà un minore impatto del rumore nell'output di ogni chiave rispetto a quello della chiave singola precedente.