Dowiedz się, co oznacza szum, gdzie jest dodawany i jak wpływa na Twoje pomiary.
Raporty podsumowujące są wynikiem agregacji raportów podlegających agregacji. Gdy raporty podlegające agregacji są grupowane przez zbieracza i przetwarzane przez usługę agregującą, do powstałych raportów podsumowujących jest dodawany szum – losowa ilość danych. Sztuczny szum jest dodawany w celu ochrony prywatności użytkowników. Celem tego mechanizmu jest zapewnienie platformy, która umożliwia pomiary z użyciem prywatności różnicowej.

Wprowadzenie do szumów w raportach podsumowujących
Chociaż dodawanie szumów nie jest obecnie częścią pomiaru skuteczności reklam, w wielu przypadkach nie spowoduje ono istotnej zmiany sposobu interpretacji wyników.
Możesz o tym pomyśleć w ten sposób: Czy czujesz się pewnie, podejmując decyzję na podstawie pewnych danych, jeśli nie są one zaśmiecone?
Czy na przykład reklamodawca może z pewnością zmienić strategię kampanii lub budżety, ponieważ kampania A uzyskała 15 konwersji, a kampania B – 16?
Jeśli odpowiedź brzmi „nie”, szum jest nieistotny.
Musisz skonfigurować korzystanie z interfejsu API w taki sposób, aby:
- Odpowiedź na powyższe pytanie brzmi „tak”.
- Zarządzanie szumem odbywa się w taki sposób, aby nie wpływać znacząco na Twoją zdolność do podejmowania decyzji na podstawie określonych danych. Możesz to zrobić w ten sposób: w przypadku oczekiwanej minimalnej liczby konwersji chcesz, aby szum w zbieranych danych był poniżej określonego procentu.
W tej i kolejnych sekcjach omówimy strategie, które pomogą Ci osiągnąć ten cel.
Podstawowe pojęcia
Usługa agregacji dodaje szum do każdej wartości podsumowania – czyli raz na klucz – za każdym razem, gdy zostanie przesłane żądanie raportu podsumowania.
Te wartości szumu są losowo pobierane z określonego rozkładu prawdopodobieństwa, o którym mowa poniżej.
Wszystkie elementy wpływające na hałas opierają się na 2 głównych koncepcjach.
Rozkład szumu (szczegóły poniżej) jest taki sam niezależnie od wartości podsumowania, czy jest ona niska czy wysoka. Dlatego im wyższa wartość podsumowująca, tym mniejszy wpływ szum ma na tę wartość.
Załóżmy na przykład, że zarówno łączna wartość zakupu w wysokości 20 tys. USD,jak i łączna wartość zakupu w wysokości 200 USD są podatne na szum wybrany z tej samej dystrybucji.
Załóżmy, że szum z tego rozkładu waha się w przybliżeniu od -100 do +100.
- W przypadku wartości zakupu w podsumowaniu wynoszącej 20 tys.USD poziom szumów mieści się w zakresie od 0 do 100/20 000=0,5%.
- W przypadku wartości łącznego zakupu wynoszącej 200 zł szum waha się od 0 do 100/200=50%.
Dlatego szum będzie miał mniejszy wpływ na łączną wartość zakupów wynoszącą 20 tys. USD niż na wartość 200 USD. W względnym ujęciu kwota 20 tys. USD prawdopodobnie będzie mniej podatna na zakłócenia, czyli prawdopodobnie będzie miała wyższy stosunek sygnału do szumu.
Ma to kilka ważnych praktycznych konsekwencji, które opisujemy w następnej sekcji. Ten mechanizm jest częścią projektu interfejsu API, a jego praktyczne konsekwencje są długofalowe. Będą one nadal odgrywać ważną rolę podczas projektowania i oceny różnych strategii agregacji przez firmy technologiczne zajmujące się reklamami.
Chociaż szum jest generowany z tej samej dystrybucji niezależnie od wartości podsumowującej, ta dystrybucja zależy od kilku parametrów. Jeden z tych parametrów, epsilon, może zostać zmieniony przez firmy technologiczne zajmujące się reklamami podczas zakończonego testu wersji źródłowej w celu oceny różnych możliwości i ustawień prywatności. Jednak możliwość dostosowania epsilona należy uznać za tymczasową. Czekamy na Twoją opinię na temat przypadków użycia i wartości epsilon, które sprawdzają się w Twoim przypadku.
Chociaż firma z branży technologii reklamowych nie ma bezpośredniej kontroli nad sposobami dodawania szumu, może wpływać na wpływ szumu na dane pomiarowe. W kolejnych sekcjach omówimy, jak w praktyce można wpływać na szum.
Zanim to zrobimy, przyjrzyjmy się bliżej sposobowi dodawania szumu.
Powiększenie: sposób dodawania szumu
Jeden rozkład szumu
Szum jest generowany na podstawie rozkładu Laplace’a z tymi parametrami:
- Średnia (
μ
) wynosi 0. Oznacza to, że najbardziej prawdopodobna wartość szumu to 0 (bez dodanego szumu) i że wartość z szumem jest tak samo prawdopodobna, aby była mniejsza od wartości oryginalnej, jak i większa (czasami nazywa się to brakiem stronniczości). - Parametr skali:
b = CONTRIBUTION_BUDGET
/epsilon
.CONTRIBUTION_BUDGET
jest zdefiniowany w przeglądarce.epsilon
jest używany w usłudze do agregacji.
Na diagramie poniżej widać funkcję gęstości prawdopodobieństwa dla rozkładu Laplace’a z μ=0 i b = 20:

Losowe wartości szumu, jeden rozkład szumu
Załóżmy, że usługa adtech prosi o raporty zbiorcze dotyczące 2 kluczy agregacji: klucz1 i klucz2.
Usługa agregacji wybiera 2 wartości szumu x1 i x2 zgodnie z tą samą dystrybucją szumu. Wartość x1 jest dodawana do wartości podsumowania dla klucza1, a wartość x2 – do wartości podsumowania dla klucza2.
Na diagramach wartości szumów będą identyczne. Jest to uproszczenie. W rzeczywistości wartości szumu będą się różnić, ponieważ są losowo pobierane z rozkładu.
Widać tu, że wartości szumu pochodzą z tej samej dystrybucji i są niezależne od wartości podsumowującej, do której są stosowane.
Inne właściwości hałasu
Szum jest stosowany do każdej wartości podsumowania, w tym do pustych wartości (0).

Na przykład nawet jeśli rzeczywista wartość podsumowania dla danego klucza wynosi 0, wartość podsumowania z dodatkowymi zakłóceniami, którą zobaczysz w raporcie podsumowania dla tego klucza, najprawdopodobniej nie będzie 0.
Szum może być liczbą dodatnią lub ujemną.

Na przykład w przypadku kwoty zakupu przed dodaniem szumu wynoszącej 327 000 szumowiny mogą wynosić +6000 lub –6000 (są to dowolne przykładowe wartości).
Ocena szumów
Obliczanie odchylenia standardowego szumu
Odchylenie standardowe szumu wynosi:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Przykład
Przy epsilon = 10 odchylenie standardowe szumu wynosi:
b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267
Sprawdzanie, kiedy różnice w pomiarach są istotne
Znasz odchylenie standardowe szumu dodanego do każdej wartości wyjściowej przez usługę agregacji, więc możesz określić odpowiednie wartości progowe do porównania, aby sprawdzić, czy zaobserwowane różnice mogą być spowodowane przez szum.
Jeśli np. szum dodany do wartości wynosi około +/- 10 (biorąc pod uwagę skalowanie), a różnica między wartościami 2 kampanii przekracza 100, można z dużą pewnością stwierdzić, że różnica między wartościami z poszczególnych kampanii nie wynika tylko z szumów.
Angażuj i dziel się opiniami
Możesz uczestniczyć w korzystaniu z tego interfejsu API i eksperymentować z nim.
- Poczytaj o raportach zbiorczych i usłudze agregacji, zadawaj pytania i zaproponuj swoją opinię.
- Przeczytaj przewodniki po raportowaniu atrybucji.
- Zadawaj pytania i dołączaj do dyskusji w repozytorium pomocy dla deweloperów Piaskownicy prywatności.
Dalsze kroki
- Aby dowiedzieć się, które zmienne możesz kontrolować, aby poprawić stosunek sygnału do szumu, zapoznaj się z artykułem Praca z szumem.
- Aby dowiedzieć się, jak zaplanować strategie raportowania agregacji, zapoznaj się z artykułem Eksperymentuj z rozwiązaniami dotyczącymi projektowania raportów zbiorczych.
- Wypróbuj Noise Lab.