Menangani derau

Pelajari cara menggunakan, memperhitungkan, dan mengurangi dampak derau dalam laporan gabungan Anda.

Sebelum memulai

Sebelum melanjutkan, untuk memahami secara mendalam apa yang dimaksud dengan derau, dan dampaknya, lihat Memahami derau dalam laporan ringkasan.

Kontrol bising untuk Anda

Meskipun Anda tidak dapat mengontrol derau yang ditambahkan ke laporan gabungan secara langsung, ada beberapa langkah yang dapat Anda ambil untuk meminimalkan dampaknya. Bagian berikut menjelaskan strategi ini.

Tingkatkan skala ke anggaran kontribusi

Seperti yang dijelaskan dalam Memahami derau, derau yang diterapkan pada nilai ringkasan untuk setiap kunci didasarkan pada skala 0-65.536 (0-CONTRIBUTION_BUDGET).

Distribusi derau didasarkan pada anggaran.

Karena itu, untuk memaksimalkan sinyal yang relatif terhadap derau, Anda harus meningkatkan skala setiap nilai sebelum menetapkannya sebagai nilai agregat—yaitu, mengalikan setiap nilai dengan faktor tertentu, faktor penskalaan, sambil memastikan nilai tersebut tetap dalam anggaran kontribusi.

Derau relatif dengan dan tanpa penskalaan.

Menghitung faktor penskalaan

Faktor penskalaan merepresentasikan seberapa besar Anda ingin menskalakan nilai agregat tertentu. Nilainya harus berupa anggaran kontribusi dibagi dengan nilai agregat maksimum untuk kunci tertentu.

Menentukan faktor penskalaan berdasarkan anggaran kontribusi.

Misalnya, anggaplah pengiklan ingin mengetahui total nilai pembelian. Anda tahu bahwa nilai pembelian maksimum yang diharapkan untuk setiap pembelian adalah Rp20.000.000, kecuali beberapa pencilan yang Anda putuskan untuk diabaikan:

  • Hitung faktor penskalaan:
    • Untuk memaksimalkan rasio sinyal terhadap gangguan, Anda harus menskalakan nilai ini menjadi 65.536 (anggaran kontribusi).
    • Ini menghasilkan 65.536 / 2.000 faktor penskalaan sekitar 32x. Dalam praktiknya, Anda dapat membulatkan faktor ini ke atas atau ke bawah.
  • Tingkatkan skala nilai Anda sebelum agregasi. Untuk setiap $1 pembelian, tambah metrik yang dilacak sebesar 32. Misalnya, untuk pembelian sebesar $120, tetapkan nilai gabungan 120*32 = 3.840.
  • Perkecil nilai setelah agregasi. Setelah Anda menerima laporan ringkasan yang berisi nilai pembelian yang dijumlahkan dari beberapa pengguna, perkecil nilai ringkasan menggunakan faktor penskalaan yang Anda gunakan sebelum penggabungan. Dalam contoh ini, kami telah menggunakan faktor penskalaan 32 pra-agregasi, jadi kami perlu membagi nilai ringkasan yang diterima dalam laporan ringkasan dengan 32. Oleh karena itu, jika nilai pembelian ringkasan untuk kunci yang diberikan dalam laporan ringkasan adalah 76.800, nilai pembelian ringkasan (dengan derau) adalah 76.800/32 = $2.400.

Memisahkan anggaran Anda

Jika Anda memiliki beberapa sasaran pengukuran—misalnya, jumlah pembelian dan nilai pembelian—Anda sebaiknya membagi anggaran untuk semua sasaran tersebut.

Dalam hal ini, faktor penskalaan Anda akan berbeda untuk nilai agregat yang berbeda, bergantung pada nilai maksimum yang diharapkan dari nilai agregat tertentu.

Baca detail di Memahami kunci agregasi.

Misalnya, asumsikan Anda melacak jumlah pembelian dan nilai pembelian, dan Anda memutuskan untuk mengalokasikan anggaran secara merata.

65.536 / 2 = 32.768 dapat dialokasikan per jenis pengukuran dan per sumber.

  • Jumlah pembelian:
    • Anda hanya melacak satu pembelian, sehingga jumlah maksimum pembelian untuk konversi tertentu adalah 1.
    • Oleh karena itu, Anda memutuskan untuk mengatur faktor penskalaan untuk jumlah pembelian ke 32.768 / 1 = 32.768.
  • Nilai pembelian:
    • Mari asumsikan nilai pembelian maksimum yang diharapkan dari setiap pembelian adalah $2.000.
    • Oleh karena itu, Anda memutuskan untuk menyetel faktor penskalaan untuk nilai pembelian ke 32.768 / 2.000 = 16,384 atau sekitar 16.

Kunci agregasi yang lebih kasar meningkatkan rasio sinyal terhadap derau

Karena kunci kasar menangkap lebih banyak peristiwa konversi daripada kunci terperinci, kunci kasar umumnya menghasilkan nilai ringkasan yang lebih tinggi.

Nilai ringkasan yang lebih tinggi tidak terlalu terpengaruh oleh derau daripada nilai yang lebih rendah; noise pada nilai ini kemungkinan akan lebih rendah, relatif terhadap nilai ini.

Nilai yang dikumpulkan dengan kunci lebih umum cenderung akan memiliki noise yang lebih sedikit dibandingkan nilai yang dikumpulkan dengan kunci yang lebih terperinci.

Contoh

Jika semua hal lainnya tetap sama, kunci yang melacak nilai pembelian secara global (dijumlahkan di seluruh negara) akan menghasilkan ringkasan nilai pembelian yang lebih tinggi (dan jumlah konversi ringkasan yang lebih tinggi) daripada kunci yang melacak konversi di tingkat suatu negara.

Oleh karena itu, derau relatif pada nilai pembelian total untuk negara tertentu akan lebih tinggi daripada derau relatif pada nilai pembelian total untuk semua negara.

Demikian pula, jika semua item lain sama, total nilai pembelian sepatu lebih rendah dari total nilai pembelian untuk semua item (termasuk sepatu).

Oleh karena itu, derau relatif pada nilai pembelian total untuk sepatu akan lebih tinggi daripada derau relatif pada nilai pembelian total untuk semua item.

Dampak derau dengan kunci terperinci versus umum.

Meringkas nilai ringkasan (penggabungan) juga akan menjumlahkan noise-nya

Dengan menjumlahkan nilai ringkasan dari laporan ringkasan untuk mengakses data tingkat lebih tinggi, Anda juga menjumlahkan derau dari nilai ringkasan ini.

Tingkat derau dengan kunci terperinci dengan penggabungan versus kunci umum tanpa penggabungan

Mari kita lihat dua pendekatan yang berbeda: - Pendekatan A: Anda menyertakan ID Geografi di kunci Anda. Laporan ringkasan mengekspos kunci tingkat ID geografis, yang masing-masing terkait dengan nilai pembelian ringkasan di tingkat ID Geografis tertentu. - Pendekatan B: Anda tidak menyertakan ID geografi di kunci Anda. Laporan ringkasan secara langsung menampilkan nilai pembelian ringkasan untuk semua ID / lokasi geografi.

Untuk mengakses nilai pembelian tingkat negara: - Dengan pendekatan A, Anda menjumlahkan nilai ringkasan level ID geografis dan juga menjumlahkan noise-nya. Hal ini mungkin menyebabkan lebih banyak derau yang ditambahkan ke nilai pembelian level ID geografis akhir. - Dengan pendekatan B, Anda melihat langsung data yang diekspos dalam laporan ringkasan. Derau hanya ditambahkan sekali ke data tersebut.

Oleh karena itu, nilai pembelian ringkasan untuk ID geografis tertentu kemungkinan akan lebih berisik dengan pendekatan A.

Demikian pula, menyertakan dimensi tingkat kode pos di kunci Anda kemungkinan akan memberikan hasil yang lebih berisik dibandingkan menggunakan kunci yang lebih kasar dengan dimensi tingkat wilayah.

Penggabungan dalam jangka waktu yang lebih lama meningkatkan rasio sinyal terhadap gangguan

Jika Anda lebih jarang meminta laporan ringkasan, setiap nilai ringkasan cenderung akan lebih tinggi dibandingkan jika Anda lebih sering meminta laporan; lebih banyak konversi cenderung terjadi dalam rentang waktu yang lebih lama.

Seperti yang disebutkan sebelumnya, semakin tinggi nilai ringkasan, kemungkinan akan semakin rendah derau relatif. Oleh karena itu, meminta laporan ringkasan lebih jarang akan menghasilkan rasio sinyal terhadap derau yang lebih tinggi (lebih baik).

Lebih jarang meminta laporan ringkasan menghasilkan sinyal rasio derau yang lebih tinggi

Berikut adalah contoh untuk mengilustrasikan:

  • Jika Anda meminta laporan ringkasan per jam selama 24 jam, lalu menjumlahkan nilai ringkasan dari setiap laporan per jam untuk mengakses data tingkat hari, derau akan ditambahkan 24 kali.
  • Dalam satu laporan ringkasan harian, derau hanya ditambahkan sekali.

Esilon lebih tinggi, noise lebih rendah

Makin tinggi nilai epsilon, makin rendah noise dan makin rendah perlindungan privasi.

Memanfaatkan pemfilteran dan penghapusan duplikat

Bagian penting dari pengalokasian anggaran di antara kunci yang berbeda adalah memahami berapa kali peristiwa tertentu dapat terjadi. Misalnya, pengiklan mungkin hanya mementingkan satu pembelian untuk setiap klik, tetapi mungkin tertarik dengan maksimal 3 "kunjungan halaman produk" konversi. Untuk mendukung kasus penggunaan ini, Anda juga dapat memanfaatkan fitur API berikut yang memungkinkan Anda mengontrol jumlah laporan yang dibuat dan konversi mana yang dihitung:

Bereksperimen dengan epsilon

Teknologi iklan dapat menyetel epsilon ke nilai yang lebih besar dari 0 dan hingga dan termasuk 64. Rentang ini memungkinkan pengujian yang fleksibel. Nilai epsilon yang lebih rendah memberikan perlindungan privasi yang lebih besar. Sebaiknya Anda memulai dengan epsilon=10.

Rekomendasi untuk eksperimen

Sebaiknya: - Dimulai dengan epsilon = 10. - Jika hal ini menyebabkan masalah utilitas yang signifikan, tingkatkan epsilon secara bertahap. - Bagikan masukan Anda tentang titik belok (inflection point) tertentu yang mungkin Anda temukan berkaitan dengan kegunaan data.

Berinteraksi dan berbagi masukan

Anda dapat berpartisipasi dan bereksperimen dengan API ini.

Langkah berikutnya