Informationen zu diesem Dokument
Wenn Sie dieses Dokument lesen, werden Sie:
- Bevor Sie Zusammenfassungsberichte erstellen, sollten Sie sich damit vertraut machen, welche Strategien Sie erstellen sollten.
- Wir stellen vor: Noise Lab, ein Tool, das die Auswirkungen verschiedener Rauschparameter erfasst und mit dem sich verschiedene Strategien zum Geräuschmanagement schnell untersuchen und bewerten lassen.

Feedback geben
In diesem Dokument werden einige Prinzipien für zusammenfassende Berichte zusammengefasst. Es gibt verschiedene Ansätze für das Geräuschmanagement, die möglicherweise nicht hier. Wir freuen uns über Vorschläge, Ergänzungen und Fragen.
- Wenn Sie an der Öffentlichkeit Feedback zu Strategien für Lärmmanagement geben möchten, Nutzen oder Datenschutz der API (Epsilon) verständlich machen und Ihre Beobachtungen mitteilen, Simulation mit Noise Lab: Kommentar zu diesem Problem
- So geben Sie öffentliches Feedback zu Noise Lab (Fragen stellen, Fehler melden, Funktionen anfordern): Hier ein neues Problem erstellen
- So geben Sie öffentliches Feedback zu einem anderen Aspekt der API: Hier kannst du eine neue Ausgabe erstellen
Vorbereitung
- Eine Einführung finden Sie in den Artikeln Attributionsberichte: zusammenfassende Berichte und Vollständige Systemübersicht zu Attribution Reporting.
- Scannen Sie Rauschen verstehen und Aggregationsschlüssel verstehen, um diese Anleitung optimal zu nutzen.
Designentscheidungen
Zentrales Designprinzip
Zwischen Drittanbieter-Cookies und Zusammenfassungsberichten gibt es grundlegende Unterschiede. Ein wichtiger Unterschied besteht darin, dass den Messdaten in Zusammenfassungsberichten Störungen hinzugefügt werden. Eine andere Möglichkeit ist die Planung von Berichten.
Damit sie auf Messdaten in Zusammenfassungsberichten mit einem höheren Signal-Rausch-Verhältnis zugreifen können, müssen Anbieter von Demand-Side-Plattformen (DSPs) und Anbieter von Anzeigenmessungen gemeinsam mit ihren Werbetreibenden Strategien zur Rauschunterdrückung entwickeln. Für die Entwicklung dieser Strategien müssen DSPs und Analyseanbieter Designentscheidungen treffen. Diese Entscheidungen drehen sich um ein wesentliches Konzept:
Die Verteilung, aus der die Rauschwerte gezogen werden, hängt zwar absolut gesehen nur von zwei Parametern ab – Epsilon und dem Beitragsbudget –, Sie haben aber eine Reihe weiterer Steuerelemente zur Verfügung, die sich auf das Signal-Rausch-Verhältnis Ihrer Ausgabemessdaten auswirken.
Wir gehen zwar davon aus, dass ein iterativer Prozess zu den besten Entscheidungen führt, doch jede Variante dieser Entscheidungen führen zu einer etwas anderen Implementierung. Daher müssen diese Entscheidungen vor dem Schreiben jeder Codeiteration und vor dem Schalten von Anzeigen getroffen werden.
Entscheidung: Detaillierungsgrad der Dimension
In Noise Lab ausprobieren
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig ist die tägliche Gesamtzahl der zugeordneten Conversions auf 1.000 festgelegt. Dies entspricht durchschnittlich etwa 40 pro Bucket, wenn Sie die Standardkonfiguration verwenden (Standarddimensionen, Standardanzahl von mögliche unterschiedliche Werte für jede Dimension, Schlüsselstrategie A). Beobachten Sie, der Wert „40“ in der Eingabe im Feld „Durchschnittliche täglich zuordenbare Conversion-Anzahl“ PRO BUCKET.
- Klicken Sie auf Simulieren, um eine Simulation mit den Standardparametern auszuführen.
- Suchen Sie im seitlichen Bereich „Parameter“ nach „Dimensionen“. Benennen Sie Geografie in Ort um und ändern Sie die Anzahl der möglichen Werte auf 50.
- Sehen Sie sich an, wie sich dadurch die durchschnittliche Anzahl der täglich zugeordneten Conversions PRO BATCH ändert. Jetzt ist er viel niedriger. Das liegt daran, dass Sie die Anzahl möglicher Werte innerhalb dieser Dimension, ohne sich zu ändern erhöhen Sie die Gesamtzahl der Buckets, wie viele Conversion-Ereignisse in jede Gruppe fallen.
- Klicken Sie auf „Simulieren“.
- Sehen Sie sich die Rauschverhältnisse der resultierenden Simulation an: Die Rauschverhältnisse sind jetzt höher als bei der vorherigen Simulation.
Gemäß dem Grundlegenden Designprinzip sind kleine Zusammenfassungswerte wahrscheinlich ungenauer als große Zusammenfassungswerte. Daher ist Ihre Konfigurationsauswahl beeinflusst, wie viele zugeordnete Conversion-Ereignisse in der jeweiligen Gruppe landen (andernfalls als Aggregationsschlüssel bezeichnet), und diese Menge wirkt sich auf das Rauschen im zusammenfassende Berichte.
Eine Designentscheidung, die sich auf die Anzahl der zugeordneten Conversion-Ereignisse auswirkt innerhalb eines einzelnen Buckets ist der Detaillierungsgrad der Dimension. Hier einige Beispiele für Aggregationsschlüssel und ihre Dimensionen:
- Methode 1: Eine Schlüsselstruktur mit groben Dimensionen: Land × Werbekampagne (oder der größte Kampagnenaggregations-Bucket) × Produkttyp (von 10 möglichen Produkttypen)
- Methode 2: Eine Schlüsselstruktur mit detaillierten Dimensionen: Stadt x Creative-ID x Produkt (von 100 möglichen Produkten)
Ort ist eine detailliertere Dimension als Land, Creative-ID ist detaillierter als Kampagne und Produkt ist detaillierter als Produkttyp. Dementsprechend wird Methode 2 hat eine geringere Anzahl von Ereignissen (Conversions) pro Bucket (= pro in der Zusammenfassungsberichtausgabe) als bei Ansatz 1. Da der der Ausgabe hinzugefügte Rauschanteil unabhängig von der Anzahl der Ereignisse im Bucket ist, sind die Messdaten in Zusammenfassungsberichten bei Ansatz 2 ungenauer. Testen Sie für jeden Werbetreibenden verschiedene Kompromisse bei der Detailgenauigkeit des Schlüssels, um die Ergebnisse optimal zu nutzen.
Entscheidung: Wichtige Strukturen
In Noise Lab ausprobieren
Im einfachen Modus wird die Standardschlüsselstruktur verwendet. Klicken Sie im Menü können Sie mit verschiedenen Schlüsselstrukturen experimentieren. Einige Beispieldimensionen enthalten sind; können Sie diese auch ändern.
- Wechsle zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Schlüsselstrategie“. Die Standardstrategie, die im Tool als „A“ bezeichnet wird, verwendet eine detaillierte Schlüsselstruktur, die alle Dimensionen umfasst: Geografie × Kampagnen-ID × Produktkategorie.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Schlüsselstrategie in B. Dadurch werden zusätzliche Steuerelemente zum Konfigurieren der Schlüsselstruktur angezeigt.
- Konfigurieren Sie die Schlüsselstruktur, z.B. wie folgt:
- Anzahl der Schlüsselstrukturen: 2
- Schlüsselstruktur 1 = Geografie x Produktkategorie.
- Schlüsselstruktur 2 = Kampagnen-ID × Produktkategorie
- Klicken Sie auf „Simulieren“.
- Sie erhalten jetzt zwei zusammenfassende Berichte pro Typ von Analyseziel. (zwei für die Anzahl der Käufe, zwei für den Kaufwert), zwei unterschiedliche Schlüsselstrukturen. Beobachten Sie ihre Rauschverhältnisse.
- Sie können dies auch mit eigenen benutzerdefinierten Dimensionen ausprobieren. Suchen Sie dazu unter „Daten, die Sie erfassen möchten“ nach „Dimensionen“. Sie sollten das Beispiel entfernen Dimensionen erstellen und mithilfe der Optionen zum Hinzufügen/Entfernen/Zurücksetzen unter der letzten Dimension.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversions auswirkt innerhalb eines Buckets Schlüsselstrukturen die Sie nutzen möchten. Hier sind einige Beispiele für Aggregationsschlüssel:
- Eine Schlüsselstruktur mit allen Dimensionen: Diese Strategie nennen wir „A“.
- Zwei Hauptstrukturen mit jeweils einer Teilmenge von Dimensionen: nennen wir das Strategie B.

Strategie A ist einfacher. Möglicherweise müssen Sie jedoch die verrauschten Zusammenfassungswerte aus Zusammenfassungsberichten zusammenfassen, um auf bestimmte Erkenntnisse zuzugreifen. Indem Sie diese Werte summieren, summieren Sie auch das Rauschen. Bei Strategie B enthalten die zusammengefassten Werte in den Zusammenfassungsberichten möglicherweise bereits die benötigten Informationen. Das bedeutet, dass Strategie B führt wahrscheinlich zu besseren Signal-Rausch-Verhältnissen als bei Strategie A. Möglicherweise ist der Rauschanteil mit Strategie A jedoch bereits akzeptabel. Daher können Sie sich aus Gründen der Einfachheit für Strategie A entscheiden. Weitere Informationen finden Sie im detaillierten Beispiel, in dem diese beiden Strategien erläutert werden.
Die Schlüsselverwaltung ist ein komplexes Thema. Eine Reihe ausgefeilter Techniken können um die Signal-Rausch-Verhältnisse zu verbessern. Eine wird unter Erweiterter Schlüssel beschrieben Verwaltung von Google-Produkten.
Entscheidung: Batching-Häufigkeit
In Noise Lab ausprobieren
- Wechseln Sie zum einfachen Modus (oder zum erweiterten Modus – beide Modi funktionieren bei der Batch-Frequenz gleich).
- Suchen Sie im seitlichen Bereich „Parameter“ nach „Aggregationsstrategie“ > „Batch-Frequenz“. Dies bezieht sich auf die Batch-Häufigkeit die mit dem Aggregationsdienst verarbeitet werden, für einen Job.
- Beachten Sie die standardmäßige Batchhäufigkeit: standardmäßig eine tägliche Batchverarbeitung Frequenz simuliert.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Ändern Sie die Häufigkeit der Batchverarbeitung in „Wöchentlich“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation: Rauschverhältnisse sind jetzt niedriger (besser) als in der vorherigen Simulation.
Eine weitere Designentscheidung, die sich auf die Anzahl der zugeordneten Conversions auswirkt für Ereignisse innerhalb eines einzelnen Buckets ist die Batchhäufigkeit, die Sie verwenden möchten. Die Die Batch-Häufigkeit gibt an, wie oft aggregierte Berichte verarbeitet werden.
In einem Bericht, der häufiger (z. B. stündlich) aggregiert wird, sind weniger Conversion-Ereignisse enthalten als in einem Bericht mit einem weniger häufigen Aggregationszeitplan (z. B. wöchentlich). Daher enthält der stündliche Bericht mehr Rauschen.``` weniger Conversion-Ereignisse enthalten als in einem Bericht mit einer Aggregationszeitplan (z.B. jede Woche). Daher hat der stündliche Bericht bei ansonsten gleichen Bedingungen ein niedrigeres Signal-Rausch-Verhältnis als der Wochenbericht. Experimentieren Sie mit Berichtsanforderungen bei verschiedenen Frequenzen und bewerten Sie jeweils das Signal-Rausch-Verhältnis.
Weitere Informationen finden Sie unter Stapelverarbeitung und Aggregierung über längere Zeiträume.
Entscheidung: Kampagnenvariablen, die sich auf zuordenbare Conversions auswirken
Im Noise Lab ausprobieren
Dies ist zwar schwer vorherzusagen und kann erhebliche Schwankungen auch saisonale Auswirkungen berücksichtigen, versuchen Sie, die Anzahl der täglichen Single-Touch-Conversions zuordnen können. 1.000 oder 10.000.
- Wechseln Sie zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Meine Conversion-Daten“.
- Beachten Sie die Standardparameter. Standardmäßig ist die tägliche Gesamtzahl der zugeordneten Conversions auf 1.000 festgelegt. Dies entspricht durchschnittlich etwa 40 pro Bucket, wenn Sie die Standardkonfiguration verwenden (Standarddimensionen, Standardanzahl von mögliche unterschiedliche Werte für jede Dimension, Schlüsselstrategie A). Beobachten Sie, der Wert „40“ in der Eingabe im Feld „Durchschnittliche täglich zuordenbare Conversion-Anzahl“ PRO BUCKET.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardparametern auszuführen.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Legen Sie nun die tägliche Anzahl der zurechenbaren Conversions auf 100 fest. Dadurch wird der Wert für die durchschnittliche tägliche Anzahl der zurechenbaren Conversions PRO KÄSTCHEN gesenkt.
- Klicken Sie auf „Simulieren“.
- Die Rauschanteile sind jetzt höher. Das liegt daran, dass bei weniger Conversions pro Bucket mehr Rauschen angewendet wird, um die Privatsphäre zu schützen.
Es ist wichtig, zwischen der Gesamtzahl der möglichen Conversions für einen Werbetreibenden und der Gesamtzahl der möglichen zugewiesenen Conversions zu unterscheiden. Letzteres wirkt sich letztendlich auf den Rauschenpegel in Zusammenfassungsberichten aus. Zugeordnet Conversions eine Teilmenge der gesamten Conversions, die häufig für Kampagnen Variablen wie Anzeigenbudget und Anzeigenausrichtung. Zum Beispiel würde ein höhere Anzahl zugeordneter Conversions bei einer Werbekampagne im Wert von 10 Millionen US-Dollar gegenüber einer Anzeige im Wert von 10. 000 US-Dollar bei allen anderen Bedingungen gleich.
Beachten Sie Folgendes:
- Vergleichen Sie die zugeordneten Conversions mit einem Attributionsmodell vom Typ „Einmal-Touch“ und „Gleiche Geräte“, da diese in den Zusammenfassungsberichten enthalten sind, die mit der Attribution Reporting API erfasst werden.
- Berücksichtigen Sie sowohl die Anzahl der zugeordneten Conversions im Worst-Case- als auch im Best-Case-Szenario. Wenn z. B. alle anderen Faktoren gleich sind, betrachten Sie die minimalen und maximalen Kampagnenbudgets für einen Werbetreibenden, dann zuordenbare Conversions für beide Ergebnisse als Eingaben für Ihre Simulationsspiele.
- Wenn Sie die Privacy Sandbox für Android verwenden möchten, sollten Sie bei der Berechnung plattformübergreifend zugeordnete Conversions berücksichtigen.
Entscheidung: Skalierung verwenden
Im Noise Lab ausprobieren
- Wechseln Sie zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > Skalierung. Die Standardeinstellung ist „Ja“.
- Um die positiven Auswirkungen der Skalierung auf das Rauschverhältnis zu verstehen, legen Sie zuerst „Skalierung“ auf „Nein“ fest.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation.
- Setzen Sie „Skalierung“ auf „Ja“. Hinweis: In Noise Lab werden die zu verwendenden Skalierungsfaktoren automatisch anhand der Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario berechnet. In einem echten System oder Ursprungstest sollten Sie Ihre eigene Berechnung für Skalierungsfaktoren implementieren.
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse sind jetzt in dieser Sekunde niedriger (besser) Simulationsspiele. Das liegt daran, dass Sie die Skalierung verwenden.
Angesichts des Designgrundsatzes wird das hinzugefügte Rauschen eine Funktion des Beitragsbudgets.
Um die Signal-Rausch-Verhältnisse zu erhöhen, können Sie sich daher für Werte, die während eines Conversion-Ereignisses erfasst werden, indem Sie sie mit den Werten des Beitragsbudgets (und dessen Skalierung nach der Aggregation). Verwenden Sie Skalierung, um Signal-Rausch-Verhältnisse zu erhöhen.
Entscheidung: Anzahl der Analyseziele und Aufteilung des Datenschutzbudgets
Weitere Informationen finden Sie unter Skalierung verwenden.
Im Noise Lab ausprobieren
Ein Analysezielvorhaben ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechseln Sie zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach Daten, die Sie erfassen möchten: Messziele Standardmäßig gibt es zwei Messziele: Käufe: Käufe und die Anzahl der Käufe.
- Klicken Sie auf „Simulieren“, um eine Simulation mit den Standardzielvorhaben auszuführen.
- Klicken Sie auf Entfernen. Dadurch wird das letzte Analyseziel entfernt (Kauf Zählung in diesem Fall).
- Klicken Sie auf „Simulieren“.
- Die Rauschverhältnisse für den Kaufwert sind jetzt niedriger (besser) für diese zweite Simulation. Das liegt daran, dass Sie weniger Messziele haben. Daher wird das gesamte Beitragsbudget jetzt auf das einzige Messziel angewendet.
- Klicken Sie auf „Zurücksetzen“. Jetzt haben Sie wieder zwei Analyseziele: Kauf und die Anzahl der Käufe. Hinweis: In Noise Lab werden die zu verwendenden Skalierungsfaktoren automatisch anhand der Bereiche (Durchschnitts- und Maximalwerte) der Messziele für Ihr Szenario berechnet. Standardmäßig wird das Budget in Noise Lab gleichmäßig auf die Analyseziele verteilt.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Beachten Sie die Skalierungsfaktoren, die in der Simulation angezeigt werden.
- Passen wir nun die Aufteilung des Datenschutzbudgets an, Signal-Rausch-Verhältnisse.
- Passen Sie den Prozentsatz des Budgets an, der für jedes Messziel zugewiesen ist. Bei der Standardeinstellung ist das Messungsziel 1, also der Kaufwert, größerer Bereich (zwischen 0 und 1.000) als bei Analyseziel 2, nämlich Anzahl der Käufe (zwischen 1 und 1, d.h. ist immer gleich 1). Aus benötigt es "mehr Platz zum Skalieren": Idealerweise sollten Beitragsbudget zu Messziel 1 als Analyseziel 2, sodass effizienter hochskaliert werden (siehe Skalierung) und daher
- Weisen Sie Messziel 1 70% des Budgets zu. Weisen Sie Zielvorhaben 2 der Messung 30 % zu.
- Klicken Sie auf „Simulieren“.
- Beobachten Sie die Rauschverhältnisse der resultierenden Simulation. Bei den Kaufpreisen sind die Rauschverhältnisse jetzt deutlich niedriger (besser) als bei der vorherigen Simulation. Die Anzahl der Käufe ist ungefähr gleich geblieben.
- Optimieren Sie die Budgetaufteilung für alle Messwerte weiter. Beobachten Sie, wie sich das auf den Rauschpegel auswirkt.
Sie können Ihre eigenen benutzerdefinierten Analyseziele festlegen. Verwenden Sie dazu das Schaltflächen zum Hinzufügen/Entfernen/Zurücksetzen.
Wenn Sie einen Datenpunkt (Messziel) für ein Conversion-Ereignis wie Conversion-Anzahl kann dieser Datenpunkt das gesamte Beitragsbudget (65.536) erhalten. Wenn Sie für ein Conversion-Ereignis mehrere Analyseziele festlegen, z. B. die Anzahl der Conversions und den Kaufwert, müssen diese Datenpunkte das Beitragsbudget teilen. So haben Sie weniger Spielraum, Werte.
Je mehr Messziele Sie haben, desto geringer sind die Signal-Rausch-Verhältnisse. wahrscheinlich (höheres Rauschen).
Eine weitere Entscheidung, die Sie in Bezug auf Analyseziele treffen müssen, ist die Budgetaufteilung. Wenn Sie das Beitragsbudget gleichmäßig auf zwei Datenpunkte aufteilen, erhält jeder Datenpunkt ein Budget von 65.536 ÷ 2 = 32.768. Das ist je nach dem maximal möglichen Wert für jeden Datenpunkt optimal oder nicht. Wenn Sie beispielsweise die Anzahl der Käufe mit einem Maximalwert von 1 und den Wert des Kaufs mit einem Minimum von 1 und einem Maximum von 120 messen, kann der Wert des Kaufs besser skaliert werden, da ihm ein größerer Anteil des Beitragsbudgets zugewiesen werden kann. Sie sehen, ob einige Analyseziele priorisiert werden sollten in Bezug auf die Auswirkungen von Lärm.
Entscheidung: Ausreißerverwaltung
Im Noise Lab ausprobieren
Ein Analysezielvorhaben ist ein einzelner Datenpunkt, der in Conversion-Ereignissen erfasst wird.
- Wechseln Sie zum erweiterten Modus.
- Suchen Sie in der Seitenleiste „Parameter“ nach „Aggregationsstrategie“ > Skalierung.
- Achten Sie darauf, dass „Scaling“ auf „Yes“ (Ja) gesetzt ist. Hinweis: Noise Lab automatisch die zu verwendenden Skalierungsfaktoren auf Basis des Bereiche (Durchschnitts- und Höchstwerte) zu definieren, die Sie für die Messziele angegeben haben.
- Nehmen wir an, dass der größte Kauf, der je getätigt wurde, 2.000 $betrug, zwischen 10 und 120 € liegen. Sehen wir uns zunächst an, bei Verwendung einer literalen Skalierung (nicht empfohlen): Geben Sie $2000 als Maximalwert für „purchaseValue“.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse hoch sind. Das liegt daran, dass unsere Skalierung derzeit auf 2.000 $berechnet, obwohl in Wirklichkeit deutlich niedriger sein werden.
- Sehen wir uns nun einen pragmatischeren Ansatz zur Skalierung an. Ändern Sie den maximalen Kaufwert in 120 $.
- Klicken Sie auf „Simulieren“.
- Beachten Sie, dass die Rauschverhältnisse in dieser zweiten Simulation niedriger (besser) sind.
Wenn Sie die Skalierung implementieren möchten, berechnen Sie in der Regel einen Skalierungsfaktor basierend auf dem maximal möglichen Wert für ein bestimmtes Conversion-Ereignis. Weitere Informationen finden Sie in diesem Beispiel.
Verwenden Sie jedoch keinen buchstäblichen Maximalwert, um diesen Skalierungsfaktor zu berechnen, da sich dadurch das Signal-Rausch-Verhältnis verschlechtert. Entfernen Sie stattdessen Ausreißer und einen pragmatischen Maximalwert.
Das Management von Ausreißern ist ein umfangreiches Thema. Eine Reihe ausgefeilter Techniken können um die Signal-Rausch-Verhältnisse zu verbessern. Eine wird beschrieben in Erweiterte Verwaltung von Ausreißern:
Nächste Schritte
Nachdem Sie verschiedene Strategien zur Verwaltung von Rauschen für Ihren Anwendungsfall bewertet haben, können Sie mit dem Testen von Zusammenfassungsberichten beginnen. Dazu erfassen Sie echte Messdaten über einen Test der Herkunft. Sehen Sie sich Leitfäden und Tipps zum Testen der API an.
Anhang
Kurze Einführung in Noise Lab
Mit Noise Lab können Sie Strategien zur Geräuschverwaltung schnell bewerten und vergleichen. Sie können damit:
- Die wichtigsten Parameter, die sich auf Rauschen auswirken können, und ihre Auswirkungen kennenlernen
- Die Auswirkungen von Rauschen auf die Ausgabemessdaten bei verschiedenen Designentscheidungen simulieren Passen Sie die Designparameter an, bis Sie ein Signal-Rausch-Verhältnis erreichen, das für Ihren Anwendungsfall geeignet ist.
- Teilen Sie uns mit, wie nützlich Sie die Zusammenfassungsberichte finden: Welche Werte für die Epsilon- und Rauschparameter funktionieren für Sie und welche nicht? Wo sind die Wendepunkte?
Betrachten Sie dies als Vorbereitungsschritt. Noise Lab generiert Messdaten, um anhand Ihrer Eingaben Zusammenfassungsberichte zu simulieren. Es werden keine Daten gespeichert oder weitergegeben.
In Noise Lab gibt es zwei verschiedene Modi:
- Einfacher Modus: Hier erfahren Sie die Grundlagen der Einstellungen für Geräusche.
- Erweiterter Modus: Verschiedene Strategien für das Geräuschmanagement testen und bewerten die zu den besten Signal-Rausch-Verhältnissen für Ihre Anwendungsfälle führt.
Klicken Sie auf die Schaltflächen im Menü oben, um zwischen den beiden Modi zu wechseln (# 1 im Screenshot unten).
Einfacher Modus
- Im einfachen Modus können Sie Parameter wie Epsilon (auf der linken Seite oder Nummer 2 im Screenshot unten) steuern und sehen, wie sich diese auf den Rauschpegel auswirken.
- Für jeden Parameter gibt es eine Kurzinfo (Schaltfläche „?“). Klicken Sie hier, um eine Erklärung der einzelnen Parameter (3. im Screenshot unten)
- Klicken Sie zuerst auf die Schaltfläche „Simulieren“ und sehen Sie sich die Ausgabe an (#4 im Screenshot unten).
- Im Bereich „Ausgabe“ sehen Sie verschiedene Details. Einige steht neben den Elementen ein „?“. Nehmen Sie sich die Zeit, auf die einzelnen "?" zu klicken, um ein Erläuterung der verschiedenen Informationen.
- Klicken Sie im Bereich „Ausgabe“ auf die Ein/Aus-Schaltfläche für Details, um eine maximierte Version der Tabelle aufzurufen (# 5 im Screenshot unten).
- Unter jeder Datentabelle im Ausgabebereich gibt es eine Option, die Tabelle zur Offlinenutzung herunterzuladen. Außerdem haben Sie rechts unten die Möglichkeit, alle Datentabellen herunterzuladen (Nummer 6 im Screenshot unten).
- Verschiedene Einstellungen für die Parameter im Bereich „Parameter“ testen
und klicken Sie auf „Simulieren“, um zu sehen, wie sie sich auf die Ausgabe auswirken:
Noise Lab-Oberfläche für den einfachen Modus
Erweiterter Modus
- Im erweiterten Modus haben Sie mehr Kontrolle über die Parameter. Ich benutzerdefinierte Analyseziele und -dimensionen hinzufügen (#1. und 2. im Screenshot) unten)
- Scrollen Sie im Bereich „Parameter“ nach unten und sehen Sie sich die Option „Schlüsselstrategie“ an. So können Sie verschiedene Schlüsselstrukturen testen (#3 im Screenshot unten).
- Wenn Sie verschiedene Schlüsselstrukturen testen möchten, ändern Sie die Schlüsselstrategie zu „B“.
- Geben Sie die Anzahl der verschiedenen Schlüsselstrukturen ein, die Sie verwenden möchten (Standardeinstellung ist „2“)
- Auf „Schlüsselstrukturen generieren“ klicken
- Optionen zum Festlegen Ihrer Schlüsselstrukturen werden angezeigt, wenn Sie auf Klicken Sie die Kästchen neben den Schlüsseln an, die Sie für die einzelnen Schlüsselstrukturen verwenden möchten.
- Klicken Sie auf Simulate (Simulieren), um die Ausgabe anzuzeigen.
Noise Lab-Benutzeroberfläche für den erweiterten Modus Noise Lab-Benutzeroberfläche für den erweiterten Modus
Rauschmesswerte
Kernkonzept
Rauschen wird hinzugefügt, um die Privatsphäre einzelner Nutzer zu schützen.
Ein hoher Rauschwert deutet darauf hin, dass Buckets/Schlüssel dünnbesetzt sind Beiträge aus einer begrenzten Anzahl sensibler Ereignisse enthalten. Fertig automatisch von Noise Lab, damit sich die Teilnehmer in der Menge verstecken, oder in um die Rechte dieser eingeschränkten Personen zu schützen. mehr Datenschutz bieten, von zusätzlichem Rauschen.
Ein geringer Rauschwert deutet darauf hin, dass die Datenkonfiguration so konzipiert wurde, eine Möglichkeit, sich „in der Menge“ zu verstecken. Das bedeutet, dass die Bucket-Daten Beiträge von einer ausreichenden Anzahl von Ereignissen enthalten, um die Privatsphäre einzelner Nutzer zu schützen.
Dies gilt sowohl für den durchschnittlichen prozentualen Fehler (APE) als auch für den Wurzel-Quadrat-Mittelwert des relativen Fehlers mit Grenzwert (RMSRE_T).
APE (durchschnittlicher prozentualer Fehler)
Der APE ist das Verhältnis von Rauschen zu Signal, also der wahre Summenwert.p> Niedrigere APE-Werte bedeuten ein besseres Signal-Rausch-Verhältnis.
Formel
Für einen bestimmten zusammenfassenden Bericht wird die APE wie folgt berechnet:

True ist der wahre Summenwert. APE ist der Durchschnitt des Rauschens über jeden wahren Summenwert, durchschnittlich über alle Einträge in einem Zusammenfassungsbericht. In Noise Lab wird dieser Wert dann mit 100 multipliziert, um einen Prozentsatz zu erhalten.
Vor- und Nachteile
Blöcke mit kleineren Größen haben einen unverhältnismäßig großen Einfluss auf den Endwert der durchschnittlichen Preiselastizität. Das kann bei der Beurteilung von Lärm irreführend sein. Deshalb haben wir einen weiteren Messwert hinzugefügt, RMSRE_T, der diese Einschränkung von APE abmildern soll. Weitere Informationen finden Sie in den Beispielen.
Code
Quellcode für die APE-Berechnung ansehen
RMSRE_T (relativer Root-Mittelwert mit einem Schwellenwert)
RMSRE_T (relativer Stamm der mittleren quadratischen Abweichung mit einem Schwellenwert) ist ein weiteres Maß für das Rauschen.
RMSRE_T interpretieren
Niedrigere RMSRE_T-Werte bedeuten bessere Signal-Rausch-Verhältnisse.
Wenn beispielsweise ein für Ihren Anwendungsfall akzeptables Rauschverhältnis 20 % beträgt und RMSRE_T = 0,2 ist, können Sie davon ausgehen, dass die Rauschpegel im akzeptablen Bereich liegen.
Formel
Für einen bestimmten Zusammenfassungsbericht wird RMSRE_T so berechnet:

Vor- und Nachteile
RMSRE_T ist etwas komplizierter als APE. Sie hat jedoch einige Vorteile, die sie in einigen Fällen besser als APE für die Analyse von Rauschen in Zusammenfassungsberichten geeignet machen:
- RMSRE_T ist stabiler. „T“ ist ein Grenzwert. „T“ gibt an, dass bei der Berechnung von RMSRE_T weniger Gewicht auf Bucket mit weniger Conversions gelegt wird, die aufgrund ihrer geringen Größe empfindlicher auf Rauschen reagieren. Bei T steigt der Messwert bei Buckets mit wenigen Conversions nicht stark an. Wenn T gleich 5 ist, wird ein Rauschwert von nur 1 bei einer Gruppe mit 0 Conversions nicht als weit über 1 angezeigt. Stattdessen wird sie auf 0, 2 begrenzt, was 1/5 entspricht, da T gleich 5 ist. Da kleinere Gruppen, die daher rauschenempfindlicher sind, weniger gewichtet werden, ist dieser Messwert stabiler und erleichtert den Vergleich von zwei Simulationen.
- RMSRE_T ermöglicht eine einfache Aggregation. Wenn Sie die RMSRE_T mehrerer Bucket mit ihren tatsächlichen Werten kennen, können Sie die RMSRE_T ihrer Summe berechnen. So können Sie auch für diese kombinierten Werte nach RMSRE_T optimieren.
Für APE ist zwar eine Aggregation möglich, die Formel ist jedoch ziemlich kompliziert, da sie den absoluten Wert der Summe von Laplace-Rauschen beinhaltet. Das erschwert die Optimierung von APE.
Code
Überprüfen Sie den Quellcode für die RMSRE_T-Berechnung.
Beispiele
Zusammenfassender Bericht mit drei Gruppen:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = Rauschen: 20, trueSummaryValue: 100
- bucket_3 = noise: 20, trueSummaryValue: 200
APE = (0,1 + 0,2 + 0,1) ÷ 3 = 13 %
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,200))^2) / 3) = sqrt( (0.01 + 0.04 + 0.01) / 3) = 0.14
Zusammenfassungsbericht mit drei Gruppen:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = Rauschen: 20, trueSummaryValue: 20
APE = (0,1 + 0,2 + 1) ÷ 3 = 43 %
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,20))^2) / 3) = sqrt( (0.01 + 0.04 + 1.0) / 3) = 0.59
Zusammenfassungsbericht mit drei Gruppen:
- bucket_1 = noise: 10, trueSummaryValue: 100
- bucket_2 = noise: 20, trueSummaryValue: 100
- bucket_3 = Rauschen: 20, trueSummaryValue: 0
APE = (0,1 + 0,2 + unendlich) / 3 = unendlich
RMSRE_T = sqrt( ( (10/max(5,100))^2 + (20/max(5,100))^2 + (20/max(5,0))^2) / 3) = sqrt( (0.01 + 0.04 + 16.0) / 3) = 2.31
Erweiterte Schlüsselverwaltung
Eine DSP oder ein Unternehmen für Anzeigenmessung kann Tausende von Werbekunden weltweit haben, die aus verschiedenen Branchen, Währungen und Kaufpreispotenzialen stammen. Das Erstellen und Verwalten eines Aggregationsschlüssels pro wahrscheinlich sehr unpraktisch sein. Außerdem ist es schwierig, einen maximal aggregierbaren Wert und ein Aggregationsbudget auszuwählen, mit dem sich die Auswirkungen von Rauschen bei diesen Tausenden von Werbetreibenden weltweit begrenzen lassen. Betrachten wir stattdessen die folgenden Szenarien:
Schlüsselstrategie A
Der Anbieter von Anzeigentechnologien beschließt, einen Schlüssel für alle für Werbekunden. Bei allen Werbetreibenden und in allen Währungen gibt es Käufe variieren von niedrigem Volumen, High-End-Käufen bis zu hohem Volumen, Low-End- Käufe. Daraus ergibt sich der folgende Schlüssel:
Schlüssel (mehrere Währungen) | |
---|---|
Maximal aggregierbarer Wert | 5.000.000 |
Kaufwertbereich | [120 – 5000000] |
Hauptstrategie B
Der Anbieter von Anzeigentechnologien beschließt, zwei Schlüssel für alle seine Werbekunden zu erstellen und zu verwalten. Er beschließt, die Schlüssel nach Währung zu trennen. Bei allen Werbetreibenden und in allen Währungen variiert die Bandbreite der Käufe von wenigen, teuren Käufen bis hin zu vielen, günstigen Käufen. Er trennt die Daten nach Währung und erstellt zwei Schlüssel:
Schlüssel 1 (USD) | Taste 2 (¥) | |
---|---|---|
Max. aggregierter Wert | 40.000 $ | 5.000.000 JPY |
Kaufwertbereich | [120–40.000] | [15.000–5.000.000] |
Bei der Schlüsselstrategie B sind die Ergebnisse weniger fehlerbehaftet als bei der Schlüsselstrategie A, da die Währungswerte nicht gleichmäßig auf die einzelnen Währungen verteilt sind. Angenommen, Käufe in japanischen Yen werden mit Käufen in US-Dollar vermischt. Das würde die zugrunde liegenden Daten und die daraus resultierende fehlerhafte Ausgabe verändern.
Hauptstrategie C
Der Anbieter von Anzeigentechnologien beschließt, vier Schlüssel für alle seine Werbekunden zu erstellen und sie nach Währung x Werbetreibendem zu trennen. Branche:
Schlüssel 1 (USD x Werbetreibende für Luxusschmuck) |
Schlüssel 2 (¥ x Werbetreibende für Luxusschmuck) |
Schlüssel 3 (USD × Werbetreibende aus der Bekleidungsbranche) |
Schlüssel 4 (¥ x Werbetreibende aus der Bekleidungsbranche) |
|
---|---|---|---|---|
Max. aggregierter Wert | 40.000 $ | 5.000.000 JPY | 500 € | 65.000 JPY |
Kaufwertbereich | [10.000–40.000] | [1.250.000–5.000.000] | [120–500] | [15.000–65.000] |
Bei der wichtigsten Strategie C sind die Ergebnisse weniger fehlerbehaftet als bei der wichtigsten Strategie B, da die Kaufwerte der Werbetreibenden nicht gleichmäßig auf die Werbetreibenden verteilt sind. Für Zum Beispiel, wie die Kombination von Anschaffungen von hochwertigem Schmuck und Anschaffungen für Baseballkappen ändern die zugrunde liegenden Daten und damit die Ausgabe.
Erstellen Sie gemeinsame Maximalwerte und Skalierungsfaktoren. auf Gemeinsamkeiten zwischen mehreren Werbetreibenden hin, um Missverständnisse bei den . Sie können beispielsweise mit den folgenden Strategien für die folgenden Bereiche experimentieren: Ihre Werbetreibenden:
- Eine Strategie, getrennt nach Währung (USD, ¥, CAD usw.)
- Eine Strategie, getrennt nach Branche des Werbetreibenden (Versicherung, Automobil, Einzelhandel usw.)
- Eine Strategie, die nach ähnlichen Kaufpreisbereichen unterteilt ist ([100], [1.000], [10.000] usw.)
Wenn Sie Strategien für gemeinsame Merkmale von Werbetreibenden entwickeln, lassen sich Schlüssel und der entsprechende Code leichter verwalten und das Signal-Rausch-Verhältnis wird höher. Verschiedene Strategien bei unterschiedlichen Werbetreibenden testen Gemeinsamkeiten, um Wendepunkte bei der Maximierung der Auswirkungen von Geräuschen im Vergleich zum Code aufzudecken zu verstehen.
Erweiterte Verwaltung von Ausreißern
Betrachten wir ein Szenario mit zwei Werbetreibenden:
- Werbetreibender A:
- Für alle Produkte auf der Website von Werbetreibendem A liegen die Kaufpreise zwischen [$120 und $1.000], was einer Spanne von 880 $ entspricht.
- Die Kaufpreise sind gleichmäßig über den Bereich von 880 $ verteilt, ohne Ausreißer, die außerhalb von zwei Standardabweichungen vom Medianwert des Kaufpreises liegen.
- Werbetreibender B:
- Für alle Produkte auf der Website von Werbetreibendem B liegen die Kaufpreise zwischen [$120 und $1.000], was einer Spanne von 880 $ entspricht.
- Die Kaufpreise liegen hauptsächlich im Bereich von 120 $ bis 500 $. Nur 5 % der Käufe liegen im Bereich von 500 $ bis 1.000 $.
Aufgrund der Anforderungen an das Beitragsbudget und der Methode, mit der Störungen auf die Endergebnisse angewendet werden, hat Werbetreibender B standardmäßig eine ungenauere Ausgabe als Werbetreibender A, da bei Werbetreibender B die Wahrscheinlichkeit höher ist, dass sich Ausreißer auf die zugrunde liegenden Berechnungen auswirken.
Sie können dieses Problem durch eine bestimmte Schlüsseleinrichtung umgehen. Wichtige Strategien testen um Ausreißerdaten zu verwalten und die Kaufwerte gleichmäßiger zu verteilen innerhalb des gesamten Kaufbereichs des Schlüssels.
Für den Werbetreibenden B könnten Sie zwei separate Schlüssel erstellen, um zwei verschiedene Kaufwertbereichen. In diesem Beispiel hat der Werbetreibende festgestellt, dass Ausreißer über dem Kaufwert von 500 $ liegen. Implementieren Sie zwei separate Schlüssel für diesen Werbetreibenden:
- Schlüsselstruktur 1: Schlüssel, der nur Käufe im Bereich von 120 $ bis 500 $ erfasst (deckt etwa 95 % des gesamten Kaufvolumens ab).
- Schlüsselstruktur 2: Schlüssel, der nur Käufe über 500 $ erfasst (ca. 5 % des gesamten Kaufvolumens).
Durch die Implementierung dieser Schlüsselstrategie können Lärm für den Werbetreibenden B und um den Nutzen aus zusammenfassenden Berichten zu maximieren. Da die neue kleinere sollten Schlüssel A und Schlüssel B nun eine einheitlichere Verteilung der Daten haben. für den jeweiligen Schlüssel des vorherigen Schlüssels. Dies führt zu weniger Rauschen in der Ausgabe jedes Schlüssels als für den vorherigen Schlüssel.