Informacje o szumach w raportach podsumowujących

Dowiedz się, co oznacza szum, gdzie jest on dodawany i jak wpływa na wyniki pomiarów.

Raporty podsumowujące są wynikiem agregacji raportów zbiorczych. Gdy kolektor zbiera raporty i przetwarza je w grupie zbiorczej, do wynikowych raportów zbiorczych dochodzi szum – losową ilość danych. Szum jest dodawany, aby chronić prywatność użytkowników. Celem tego mechanizmu jest stworzenie platformy do obsługi pomiarów prywatności różnicowej.

Szum jest dodawany do końcowego raportu podsumowującego.

Wprowadzenie do szumu w raportach podsumowujących

Chociaż dodawanie szumu nie jest obecnie jednym z elementów pomiaru reklam, w wielu przypadkach nie wpłynie to znacząco na sposób interpretacji wyników.

Warto myśleć o nich w ten sposób: Czy możesz mieć pewność, że podejmiesz decyzję na podstawie danych z konkretnych danych, jeśli nie były one szumne?

Czy reklamodawca może na przykład mieć pewność, że zmieni strategię lub budżety kampanii, biorąc pod uwagę fakt, że kampania A uzyskała 15 konwersji, a kampania B 16?

Jeśli odpowiedź jest przecząca, szum nie ma znaczenia.

Musisz skonfigurować sposób korzystania z interfejsu API w taki sposób, aby:

  1. Odpowiedź na pytanie powyżej jest twierdząca.
  2. Zarządzanie szumem nie wpływa znacząco na możliwość podejmowania decyzji na podstawie określonych danych. Oto, co możesz zrobić: w przypadku oczekiwanej minimalnej liczby konwersji szum w zbieranych danych powinien pozostawać poniżej określonego procentu.

W tej sekcji i w kolejnych krokach omawiamy strategie

Podstawowe pojęcia

Usługa agregacji dodaje szum do każdej wartości podsumowania jeden raz, czyli raz na klucz – przy każdym żądaniu raportu podsumowującego.

Wartości szumu są pobierane losowo ze określonego rozkładu prawdopodobieństwa, które omówiliśmy poniżej.

Wszystkie elementy, które wpływają na szum, zależą od 2 głównych koncepcji.

  1. Rozkład szumu (szczegóły poniżej) jest taki sam niezależnie od wartości podsumowania, czy jest niski czy wysoki. Dlatego im wyższa wartość podsumowania, tym mniejszy wpływ szumu w odniesieniu do tej wartości.

    Załóżmy na przykład, że zarówno łączna wartość zakupu wynosząca 20 tys. zł,jak i łączna wartość zakupu wynosząca 200 zł podlegają szumowi wybranemu z tego samego rozkładu.

    Załóżmy, że szum z tego rozkładu waha się w przedziale od -100 do +100.

    • W przypadku podsumowania wartości zakupu wynoszącej 20 000 USD szum waha się w przedziale od 0 do 100/20 000=0,5%.
    • W przypadku podsumowania wartości zakupu wynoszącej 200 zł szum różni się w przedziale od 0 do 100/200=50%.

    W związku z tym szum będzie miał mniejszy wpływ na łączną wartość zakupu wynoszącą 20 tys. zł niż na wartość 200 zł. Względnie 20 tys. USD będzie raczej mniej hałasować, ponieważ może też mieć wyższy współczynnik sygnału do szumu.

    Wyższe wartości zagregowane mają względnie mniejszy wpływ szumu.

    Wiąże się to z kilkoma ważnymi praktycznymi konsekwencjami, które zostały opisane w następnej sekcji. Ten mechanizm jest częścią projektowania interfejsów API, a jego praktyczne konsekwencje są długoterminowe. Nadal będą odgrywać ważną rolę przy projektowaniu i ocenianiu różnych strategii agregacji.

  2. Chociaż szum jest pobierany z tego samego rozkładu niezależnie od wartości podsumowania, rozkład ten zależy od kilku parametrów. Jeden z tych parametrów, epsilon, może zostać zmieniony przez technologie reklamowe w trakcie zakończonego testowania origin w celu oceny różnych korekt związanych z użytecznością i prywatnością. Możliwość zmiany kodu epsilon należy jednak traktować jako tymczasową. Chętnie poznamy Twoją opinię na temat przypadków użycia i wartości, które dobrze się sprawdzają w technologii epsilon.

Chociaż firma z branży technologii reklamowych nie ma bezpośredniej kontroli nad sposobami dodawania szumu, może wpływać na jego dane pomiarowe. W kolejnych sekcjach podpowiemy, jak w praktyce można wpłynąć na hałas.

Zanim to zrobimy, przyjrzyjmy się bliżej sposobowi stosowania szumu.

Powiększanie: sposób stosowania szumu

Jeden rozkład szumu

Szum jest pobierany z rozkładu Laplace'a z następującymi parametrami:

  • Średnia (μ) o wartości 0. Oznacza to, że najbardziej prawdopodobna wartość szumu to 0 (brak dodanego szumu), a wartość zaszumionego szumu jest zazwyczaj mniejsza niż wartość szumu (prawdopodobnie jest większa, tzw. obiektywny szum).
  • Parametr skali b = CONTRIBUTION_BUDGET / epsilon.
    • Element CONTRIBUTION_BUDGET jest zdefiniowany w przeglądarce.
    • epsilon jest ustawiony na stałe na serwerze agregacji.

Poniższy diagram przedstawia funkcję gęstości prawdopodobieństwa dla rozkładu Laplace'a z μ=0, b = 20:

Funkcja gęstości prawdopodobieństwa dla rozkładu Laplace'a z μ=0, b = 20

Losowe wartości szumu, jeden rozkład szumu

Załóżmy, że dane podsumowujące żądania technologii reklamowych dotyczą 2 kluczy agregacji: klucz1 i klucz2.

Usługa agregująca wybiera 2 wartości szumu x1 i x2, zachowując ten sam rozkład szumu. Wartość x1 jest dodawana do wartości podsumowania klucza1, a x2 do wartości podsumowania klucza 2.

Na diagramach wartości szumu przedstawimy jako identyczne. Jest to uproszczenie. W rzeczywistości wartości szumu będą się różnić, ponieważ są pobierane losowo z rozkładu.

Pokazuje to, że wartości szumu pochodzą z tego samego rozkładu i są niezależne od wartości podsumowania, do której są stosowane.

Inne właściwości szumu

Szum jest stosowany do każdej wartości podsumowania, w tym do wartości pustych (0).

Nawet puste wartości podsumowania mogą być szumem.

Na przykład nawet jeśli prawdziwa wartość podsumowania dla danego klucza wynosi 0, zaszumiona wartość podsumowania widoczna w raporcie podsumowującym dla tego klucza nie będzie (najprawdopodobniej) 0.

Szum może być liczbą dodatnią lub ujemną.

Przykłady szumu pozytywnego i negatywnego.

Na przykład w przypadku zakupu na kwotę 327 tys. przed szumem szum może wynosić +6000 lub -6000 (są to dowolne przykładowe wartości).

Oceniam szum

Obliczanie odchylenia standardowego szumu

Odchylenie standardowe szumu to:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Przykład

Gdy epsilon = 10, odchylenie standardowe szumu wynosi:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Określanie, kiedy różnice w pomiarach są istotne

Znasz odchylenie standardowe szumu dodanego do każdej wartości wyjściowej przez usługę agregacji, więc możesz określić odpowiednie progi porównania, aby sprawdzić, czy zaobserwowane różnice mogą wynikać z szumu.

Jeśli na przykład szum dodany do wartości wynosi około +/-10 (oblicza za skalowanie), a różnica w wartości między 2 kampaniami przekracza 100, można bezpiecznie założyć, że różnica w wartościach zmierzonych w poszczególnych kampaniach nie wynika z samego szumu.

Angażuj i dziel się opiniami

Możesz uczestniczyć w korzystaniu z tego interfejsu API i eksperymentować z nim.

Dalsze kroki