Memahami derau dalam laporan ringkasan

Pelajari arti derau, tempat derau ditambahkan, dan pengaruhnya terhadap upaya pengukuran Anda.

Laporan ringkasan adalah hasil agregasi laporan agregat. Saat laporan gabungan dikelompokkan oleh pengumpulan dan diproses oleh layanan agregasi, derau—jumlah data acak—ditambahkan ke laporan ringkasan yang dihasilkan. Derau ditambahkan untuk melindungi privasi pengguna. Tujuan mekanisme ini adalah memiliki framework yang dapat mendukung pengukuran pribadi diferensial.

Derau ditambahkan dalam laporan ringkasan akhir.

Pengantar derau dalam laporan ringkasan

Meskipun menambahkan derau biasanya bukan bagian dari pengukuran iklan saat ini, dalam banyak kasus, derau yang ditambahkan tidak akan mengubah cara Anda menafsirkan hasil secara substansial.

Sebaiknya pikirkan hal ini dengan cara berikut: Apakah Anda akan yakin mengambil keputusan berdasarkan data tertentu jika data tersebut tidak berisi derau?

Misalnya, apakah pengiklan akan yakin untuk mengubah strategi atau anggaran kampanyenya, berdasarkan fakta bahwa Kampanye A memiliki 15 konversi dan Kampanye B memiliki 16 konversi?

Jika jawabannya tidak, derau tidak relevan.

Yang perlu Anda lakukan adalah mengonfigurasi penggunaan API sedemikian rupa sehingga:

  1. Jawaban atas pertanyaan di atas adalah ya.
  2. Derau dikelola dengan cara yang tidak memengaruhi kemampuan Anda untuk membuat keputusan berdasarkan data tertentu secara signifikan. Anda dapat melakukannya sebagai berikut: untuk jumlah minimum konversi yang diharapkan, Anda ingin menjaga derau dalam metrik yang dikumpulkan di bawah % tertentu.

Di bagian ini dan berikutnya, kami akan menguraikan strategi untuk mencapai 2.

Konsep inti

Layanan agregasi menambahkan derau sekali ke setiap nilai ringkasan—yaitu, sekali per kunci—setiap kali laporan ringkasan diminta.

Nilai derau ini diambil secara acak dari distribusi probabilitas tertentu, yang dibahas di bawah.

Semua elemen yang memengaruhi derau bergantung pada dua konsep utama.

  1. Distribusi derau (detail di bawah) sama, terlepas dari nilai ringkasan, rendah atau tinggi. Oleh karena itu, semakin tinggi nilai ringkasan, semakin kecil kemungkinan derau memengaruhi, relatif terhadap nilai ini.

    Misalnya, asumsikan total nilai pembelian gabungan sebesar $20.000 dan total nilai pembelian gabungan sebesar $200 tunduk pada derau yang dipilih dari distribusi yang sama.

    Mari kita asumsikan derau dari distribusi ini bervariasi kira-kira antara -100 dan +100.

    • Untuk nilai pembelian ringkasan sebesar $20.000, derau bervariasi antara 0 dan 100/20.000=0,5%.
    • Untuk nilai pembelian ringkasan sebesar $200, derau bervariasi antara 0 dan 100/200=50%.

    Oleh karena itu, derau cenderung memiliki dampak yang lebih rendah pada nilai pembelian gabungan sebesar $20.000 daripada nilai $200. Secara relatif, $20.000 cenderung lebih sedikit berisi derau, yaitu cenderung memiliki rasio sinyal-derau yang lebih tinggi.

    Nilai gabungan yang lebih tinggi memiliki dampak derau yang relatif lebih rendah.

    Hal ini memiliki beberapa implikasi praktis penting yang diuraikan di bagian berikutnya. Mekanisme ini adalah bagian dari desain API, dan implikasi praktisnya bersifat jangka panjang. Cookie akan terus memainkan peran penting saat teknologi iklan mendesain dan mengevaluasi berbagai strategi agregasi.

  2. Meskipun derau diambil dari distribusi yang sama, terlepas dari nilai ringkasan, distribusi tersebut bergantung pada beberapa parameter. Salah satu parameter ini, epsilon, dapat diubah oleh teknologi iklan selama uji coba origin yang telah selesai untuk mengevaluasi berbagai penyesuaian utilitas/privasi. Namun, pertimbangkan kemampuan untuk menyesuaikan epsilon sebagai sementara. Kami menerima masukan Anda tentang kasus penggunaan dan nilai epsilon yang berfungsi dengan baik.

Meskipun tidak memiliki kontrol langsung atas cara penambahan derau, perusahaan teknologi iklan dapat memengaruhi dampak derau pada data pengukurannya. Di bagian berikutnya, kita akan mempelajari bagaimana derau dapat dipengaruhi dalam praktik.

Sebelum melakukannya, mari kita pelajari lebih lanjut cara penerapan derau.

Memperbesar: cara derau diterapkan

Satu distribusi derau

Derau diambil dari distribusi Laplace, dengan parameter berikut:

  • Rata-rata (μ) sebesar 0. Ini berarti bahwa nilai derau yang paling mungkin adalah 0 (tidak ada derau yang ditambahkan), dan nilai derau kemungkinan sama kecilnya dengan yang asli dan sama besarnya (ini terkadang disebut tidak bias).
  • Parameter skalab = CONTRIBUTION_BUDGET / epsilon.
    • CONTRIBUTION_BUDGET ditentukan di browser.
    • epsilon digunakan di Layanan Agregasi.

Diagram berikut menunjukkan fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20:

Fungsi kepadatan probabilitas untuk distribusi Laplace dengan μ=0, b = 20

Nilai derau acak, satu distribusi derau

Mari kita asumsikan bahwa teknologi iklan meminta laporan ringkasan untuk dua kunci agregasi, key1 dan key2.

Layanan agregasi memilih dua nilai derau x1 dan x2, mengikuti distribusi derau yang sama. x1 ditambahkan ke nilai ringkasan untuk key1, dan x2 ditambahkan ke nilai ringkasan untuk key2.

Dalam diagram, kita akan merepresentasikan nilai derau sebagai identik. Ini adalah penyederhanaan; pada kenyataannya, nilai derau akan bervariasi, karena diambil secara acak dari distribusi.

Hal ini mengilustrasikan bahwa semua nilai derau berasal dari distribusi yang sama, dan tidak bergantung pada nilai ringkasan tempat nilai tersebut diterapkan.

Properti derau lainnya

Derau diterapkan ke setiap nilai ringkasan—termasuk nilai kosong (0).

Bahkan nilai ringkasan kosong dapat terpengaruh oleh derau.

Misalnya, meskipun nilai ringkasan sebenarnya untuk kunci tertentu adalah 0, nilai ringkasan yang berisi derau yang akan Anda lihat dalam laporan ringkasan untuk kunci ini (kemungkinan besar) tidak akan bernilai 0.

Derau dapat berupa angka positif atau negatif.

Contoh derau positif dan negatif.

Misalnya, untuk jumlah pembelian sebelum derau sebesar 327.000, derau dapat berupa +6.000 atau -6.000 (ini adalah contoh nilai arbitrer).

Mengevaluasi derau

Menghitung simpangan baku derau

Simpangan baku derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2)
Contoh

Dengan epsilon = 10, standar deviasi derau adalah:

b*sqrt(2) = (CONTRIBUTION_BUDGET / epsilon)*sqrt(2) = (65,536/10)*sqrt(2) = 9,267

Mengevaluasi kapan perbedaan pengukuran signifikan

Karena Anda akan mengetahui standar deviasi derau yang ditambahkan ke setiap output nilai oleh layanan agregasi, Anda dapat menentukan nilai minimum yang sesuai untuk perbandingan guna menentukan apakah perbedaan yang diamati dapat disebabkan oleh derau.

Misalnya, jika derau yang ditambahkan ke nilai adalah sekitar +/- 10 (dengan mempertimbangkan penskalaan) dan perbedaan nilai antara dua kampanye adalah lebih dari 100, Anda dapat menyimpulkan bahwa perbedaan nilai yang diukur antara setiap kampanye tidak hanya disebabkan oleh derau.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya