Rauschen in Zusammenfassungsberichten

Hier erfahren Sie, was „Rauschen“ bedeutet, wo es hinzugefügt wird und wie es sich auf Ihre Analysemaßnahmen auswirkt.

Zusammenfassungsberichte sind das Ergebnis der Aggregation von zusammengefassten Berichten. Wenn aggregierte Berichte von einem Collector zusammengefasst und vom Aggregationsdienst verarbeitet werden, wird Rauschen – eine zufällige Datenmenge – zu den resultierenden Zusammenfassungsberichten hinzugefügt. Zum Schutz der Privatsphäre von Nutzern wird Rauschen hinzugefügt. Ziel dieses Verfahrens ist ein Framework, das Differential Privacy-Messungen unterstützt.

Im abschließenden zusammenfassenden Bericht werden Rauschen hinzugefügt.

Einführung in das Rauschen in Zusammenfassungsberichten

Obwohl das Hinzufügen von Rauschen derzeit in der Regel nicht Teil der Anzeigenmessung ist, wirkt sich das hinzugefügte Rauschen in vielen Fällen nicht wesentlich auf die Interpretation der Ergebnisse aus.

Es kann hilfreich sein, es sich so zu vorstellen: Wären Sie sicher, eine Entscheidung auf der Grundlage bestimmter Daten zu treffen, wenn diese Daten nicht verrauscht wären?

Würde ein Werbetreibender beispielsweise sicher sein, seine Kampagnenstrategie oder -budgets zu ändern, wenn er auf Kampagne A 15 Conversions und Kampagne B 16 Conversions erzielt hat?

Wenn die Antwort nein lautet, ist Rauschen irrelevant.

Sie sollten die API-Nutzung jedoch so konfigurieren, dass:

  1. Die Antwort auf die obige Frage lautet „Ja“.
  2. Rauschen wird so gehandhabt, dass Ihre Fähigkeit, eine Entscheidung auf der Grundlage bestimmter Daten zu treffen, nicht wesentlich beeinträchtigt wird. So können Sie vorgehen: Für eine erwartete Mindestanzahl von Conversions soll das Rauschen im erfassten Messwert unter einem bestimmten Prozentsatz bleiben.

In diesem und folgenden Abschnitt werden Strategien umrissen, mit denen Sie 2 erreichen.

Wichtige Konzepte

Der Aggregationsdienst fügt jedem Zusammenfassungswert, also einmal pro Schlüssel, bei jeder Anforderung eines zusammenfassenden Berichts ein Rauschen hinzu.

Diese Rauschwerte werden nach dem Zufallsprinzip aus einer spezifischen Wahrscheinlichkeitsverteilung ermittelt, wie unten erläutert.

Alle Elemente, die das Rauschen beeinflussen, basieren auf zwei Hauptkonzepten.

  1. Die Rauschverteilung (Details siehe unten) ist gleich, unabhängig vom Gesamtwert, d. h. niedrig oder hoch. Daher gilt: Je höher der Gesamtwert, desto geringer die Auswirkungen des Rauschens im Verhältnis zu diesem Wert.

    Angenommen, sowohl ein aggregierter Gesamtwert von 20.000 € als auch ein aggregierter Gesamtwert von 200 € unterliegen einer verrauschten Auswahl aus derselben Verteilung.

    Nehmen wir an, dass das Rauschen aus dieser Verteilung ungefähr zwischen -100 und +100 variiert.

    • Beim zusammenfassenden Kaufwert von 20.000 $variiert das Rauschen zwischen 0 und 100/20.000=0,5%.
    • Beim zusammenfassenden Kaufwert von 200 € variiert das Rauschen zwischen 0 und 100/200=50%.

    Daher wirkt sich Rauschen wahrscheinlich weniger auf den aggregierten Kaufwert von 20.000 € aus als auf den Wert von 200 €. Im Vergleich dazu sind 20.000 $ wahrscheinlich weniger Rauschen, das heißt, es ist wahrscheinlich ein höheres Signal-Rausch-Verhältnis.

    Höhere aggregierte Werte haben eine relativ geringere Auswirkung auf das Rauschen.

    Dies hat einige wichtige praktische Auswirkungen, die im nächsten Abschnitt beschrieben werden. Dieser Mechanismus ist Teil des API-Designs und die praktischen Auswirkungen sind langfristig. Sie spielen auch weiterhin eine wichtige Rolle bei der Entwicklung und Bewertung verschiedener Aggregationsstrategien für Anzeigentechnologien.

  2. Während das Rauschen unabhängig vom Zusammenfassungswert aus derselben Verteilung stammt, hängt diese Verteilung von mehreren Parametern ab. Einer dieser Parameter, Epsilon, könnte von AdTech-Teams während des Ursprungstests geändert werden, um verschiedene Nützlichkeits- und Datenschutzanpassungen zu bewerten. Sie sollten jedoch die Möglichkeit zur Anpassung von Epsilon als temporär betrachten. Wir freuen uns über Feedback zu Ihren Anwendungsfällen und den Werten von Epsilon, die gut funktionieren.

Auch wenn ein AdTech-Unternehmen nicht direkt steuern kann, wie Rauschen hinzugefügt wird, kann es die Auswirkungen von Rauschen auf seine Messdaten beeinflussen. In den nächsten Abschnitten sehen wir uns an, wie Rauschen in der Praxis beeinflusst werden kann.

Sehen wir uns vorher genauer an, wie Rauschen angewendet wird.

Heranzoomen: Anwendung von Rauschen

Eine Rauschverteilung

Das Rauschen wird aus der Laplace-Verteilung mit den folgenden Parametern entnommen:

  • Ein Mittelwert (μ) von 0. Das bedeutet, dass der wahrscheinlichste Rauschwert 0 ist (kein Rauschen hinzugefügt) und dass der Rauschwert mit der gleichen Wahrscheinlichkeit kleiner als das Original ist, wie er größer ist (dies wird manchmal als unverzerrt bezeichnet).
  • Ein Skalierungsparameter von b = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ist im Browser definiert.
    • epsilon ist im Aggregationsserver festgelegt.

Das folgende Diagramm zeigt die Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20:

Wahrscheinlichkeitsdichtefunktion für eine Laplace-Verteilung mit μ=0, b = 20

Zufällige Rauschwerte, eine Rauschverteilung

Angenommen, eine AdTech-Anwendung fordert zusammenfassende Berichte für die beiden Aggregationsschlüssel „key1“ und „key2“ an.

Der Aggregationsdienst wählt zwei Rauschwerte x1 und x2 nach derselben Rauschverteilung aus. x1 wird zum Zusammenfassungswert für key1 addiert und x2 wird zum Zusammenfassungswert für key2 addiert.

In den Diagrammen stellen wir Rauschwerte identisch dar. Dies ist eine Vereinfachung. In Wirklichkeit variieren die Rauschwerte, da sie zufällig aus der Verteilung bezogen werden.

Dies zeigt, dass die Rauschwerte alle aus derselben Verteilung stammen und unabhängig von der Zusammenfassung sind, auf die sie angewendet werden.

Weitere Eigenschaften von Rauschen

Rauschen wird auf jeden zusammenfassenden Wert angewendet – auch auf leere Werte (0).

Selbst leere Zusammenfassungswerte können verrauscht werden.

Selbst wenn beispielsweise der tatsächliche Zusammenfassungswert für einen bestimmten Schlüssel 0 ist, ist der verrauschte Zusammenfassungswert, den Sie im Zusammenfassungsbericht für diesen Schlüssel sehen, höchstwahrscheinlich nicht 0.

Rauschen kann entweder eine positive oder eine negative Zahl sein.

Beispiele für positives und negatives Rauschen

Beispiel: Bei einem Vorraus-Kaufbetrag von 327.000 kann das Rauschen +6.000 oder -6.000 betragen (dies sind beliebige Beispielwerte).

Rauschen wird ausgewertet

Die Standardabweichung des Rauschens berechnen

Die Standardabweichung des Rauschens lautet:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Beispiel

Bei Epsilon = 10 beträgt die Standardabweichung des Rauschens:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Beurteilen, wann signifikante Messunterschiede auftreten

Da Sie die Standardabweichung des Rauschens kennen, die jedem vom Aggregationsdienst ausgegebenen Wert hinzugefügt wird, können Sie geeignete Grenzwerte für den Vergleich festlegen, um festzustellen, ob die beobachteten Unterschiede auf Rauschen zurückzuführen sein könnten.

Wenn beispielsweise das zu einem Wert hinzugefügte Rauschen ca. +/- 10 (unter Berücksichtigung der Skalierung) und die Differenz des Werts zwischen zwei Kampagnen über 100 liegt, können Sie davon ausgehen, dass der Unterschied beim gemessenen Wert zwischen den einzelnen Kampagnen nicht allein auf Rauschen zurückzuführen ist.

Reagieren und Feedback geben

Sie können an dieser API teilnehmen und sie testen.

Nächste Schritte