Klasifikasi topik

Baca bagaimana topik disimpulkan, bagaimana topik tersebut ditetapkan kepada pengguna browser, dan cara pengguna mengontrol daftar topik mereka.

Status penerapan

  • Topics API telah menyelesaikan fase diskusi publik dan saat ini tersedia untuk 99 persen pengguna, dengan peningkatan skala hingga 100 persen.
  • Untuk memberikan masukan tentang Topics API, buat Masalah di Penjelasan topik atau berpartisipasi dalam diskusi di Meningkatkan Grup Bisnis Periklanan Web. Penjelasan memiliki sejumlah pertanyaan terbuka yang masih memerlukan definisi lebih lanjut.
  • Linimasa Privacy Sandbox memberikan linimasa penerapan untuk Topics API dan proposal Privacy Sandbox lainnya.
  • Topics API: update terbaru menjelaskan perubahan dan peningkatan kualitas Topics API dan implementasinya.

Apa yang dimaksud dengan topik?

Topik, di Topics API, adalah subjek yang diminati pengguna, sebagaimana dibuktikan oleh situs yang mereka kunjungi.

Topik adalah sinyal untuk membantu platform teknologi iklan memilih iklan yang relevan. Tidak seperti cookie pihak ketiga, informasi ini dibagikan tanpa mengungkapkan informasi lebih lanjut tentang pengguna itu sendiri atau aktivitas penjelajahan pengguna.

Topics API memungkinkan pihak ketiga, seperti platform teknologi iklan, untuk mengamati lalu mengakses topik yang diminati pengguna. Misalnya, API mungkin menyarankan topik "Fiber & Seni Tekstil" untuk pengguna yang mengunjungi situs knitting.example.

Daftar topik yang digunakan oleh Topics API bersifat publik, diseleksi oleh manusia, dapat dibaca oleh manusia, dan dirancang untuk menghindari kategori sensitif. Ini adalah daftar saat ini, yang akan diperluas seiring waktu. Daftar ini disusun sebagai taksonomi. Topiknya dapat bersifat umum atau lebih spesifik. Misalnya, Food & Drink adalah kategori yang luas, dengan subkategori Cooking & Recipes. Sub-kategori dapat dibagi lagi menjadi subkategori tambahan.

Taksonomi topik semacam itu perlu melakukan kompromi antara utilitas dan privasi. Jika topiknya terlalu spesifik, topik dapat digunakan untuk mengidentifikasi pengguna perorangan. Jika terlalu umum, thumbnail tersebut tidak berguna untuk memilih iklan atau konten lainnya.

Taksonomi topik disusun dengan mempertimbangkan dua persyaratan dasar:

  • Mendukung periklanan menurut minat
  • Jaga keamanan pengguna dan lindungi privasi mereka

Hal ini menyarankan beberapa pertanyaan. Contoh:

  • Apa cara terbaik yang dapat dilakukan API untuk menyimpulkan topik minat bagi pengguna, berdasarkan aktivitas penjelajahan mereka, sekaligus menjaga privasi pengguna?
  • Bagaimana taksonomi dapat disusun untuk membuatnya lebih berguna?
  • Item spesifik apa yang harus disertakan dalam taksonomi tersebut?

Cara API menyimpulkan topik untuk situs

Topik berasal dari model pengklasifikasi yang memetakan nama host situs ke nol atau beberapa topik. Menganalisis informasi tambahan (seperti URL lengkap atau konten halaman) dapat memungkinkan iklan yang lebih relevan, tetapi juga dapat mengurangi privasi.

Model pengklasifikasi untuk memetakan nama host ke topik tersedia untuk publik, dan sesuai catatan penjelasan, topik situs dapat dilihat melalui alat developer browser. Model ini diharapkan berkembang dan menjadi lebih baik dari waktu ke waktu serta diperbarui secara berkala; frekuensinya masih dipertimbangkan.

Hanya situs yang menyertakan kode yang memanggil Topics API yang disertakan dalam histori penjelajahan yang memenuhi syarat untuk penghitungan frekuensi topik, dan pemanggil API hanya akan menerima topik yang mereka amati. Dengan kata lain, situs tidak memenuhi syarat untuk penghitungan frekuensi topik tanpa situs atau layanan tersemat yang memanggil API.

Selain itu, pemanggil hanya dapat menerima topik yang telah "dilihat" oleh kodenya. Jadi, jika kode penelepon lain mendaftarkan topik, misalnya /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, untuk browser pengguna dan kode Anda tidak menyebabkan topik tersebut didaftarkan untuk browser pengguna tersebut, Anda tidak akan dapat mempelajari topik minat tersebut untuk browser pengguna tersebut saat memanggil API dari kode sematan. Perlu diketahui bahwa karena API sekarang menyertakan ancestor seperti yang telah diamati, contoh di atas, /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, juga akan menyebabkan Autos & Vehicles dan Motor Vehicles diamati.

Topik yang ditampilkan untuk pengguna dihitung ulang untuk pemanggil, bergantung pada situs tingkat atas. Misalnya, jika adtech.example meminta topik pengguna pada news-a.example, pada news-b.example, lalu pada news-c.example, topik yang ditampilkan kepada topik tersebut akan dihitung ulang di setiap situs. Ini berarti pemanggil kemungkinan mendapatkan topik yang berbeda untuk pengguna di berbagai situs tingkat atas karena tiga topik (maksimum) yang ditampilkan untuk pengguna dipilih secara acak dari lima teratas selama tiga epoch terakhir (dengan peluang 5% mendapatkan topik acak). Hal ini akan mempersulit penelepon untuk mengidentifikasi pengguna berdasarkan topiknya, karena topik ini cenderung berbeda di berbagai situs tingkat atas (bahkan untuk pengguna, pemanggil, dan epoch yang sama).

Model pengklasifikasi

Topik diseleksi secara manual untuk 50.000 domain teratas, dan seleksi ini digunakan untuk melatih pengklasifikasi. Daftar ini dapat ditemukan di override_list.pb.gz, yang tersedia di chrome://topics-internals/ pada model saat ini di tab Pengklasifikasi. Pengaitan domain ke topik dalam daftar digunakan oleh API sebagai pengganti output model itu sendiri.

halaman chrome://topics-internals dengan panel Pengklasifikasi dipilih.
Panel Pengklasifikasi halaman chrome://topics-internals mencantumkan versi model, jalurnya, dan topik yang terkait dengan setiap host yang tercantum.

Untuk menjalankan model secara langsung, lihat panduan TensorFlow untuk menjalankan model.

Untuk memeriksa file override_list.pb.gz, ekstrak file terlebih dahulu:

gunzip -c override_list.pb.gz > override_list.pb

Gunakan protoc untuk memeriksanya sebagai teks:

protoc --decode_raw < override_list.pb > output.txt

Taksonomi topik dengan ID lengkap tersedia di GitHub.

Memberikan masukan atau input pada model pengklasifikasi

Ada beberapa channel untuk memberikan masukan tentang Topics API. Untuk mendapatkan masukan tentang model pengklasifikasi, sebaiknya kirim masalah GitHub atau balas masalah yang ada. Contoh:

Cara lima topik teratas pengguna dipilih

API menampilkan satu topik untuk setiap epoch, hingga maksimum tiga topik. Jika tiga hasil ditampilkan, nilai ini mencakup topik untuk epoch saat ini dan dua epoch sebelumnya.

  1. Di akhir setiap epoch, browser akan menyusun daftar halaman yang memenuhi kriteria berikut:
    • Halaman dikunjungi oleh pengguna selama epoch.
    • Halaman ini menyertakan kode yang memanggil document.browsingTopics().
    • API diaktifkan (misalnya, tidak diblokir oleh pengguna atau melalui header respons).
  2. Di perangkat pengguna, browser menggunakan model pengklasifikasi yang disediakan oleh Topics API untuk memetakan nama host setiap halaman ke daftar topik.
  3. Browser mengumpulkan daftar topik.
  4. Browser akan membuat daftar lima topik teratas menurut frekuensi.

Metode document.browsingTopics() kemudian menampilkan topik acak dari lima epoch teratas untuk setiap epoch, dengan kemungkinan 5% bahwa salah satunya dapat dipilih secara acak dari taksonomi topik lengkap. Di Chrome, pengguna juga dapat menghapus topik tertentu, atau menghapus histori penjelajahan mereka untuk mengurangi jumlah topik yang ditampilkan oleh API. Pengguna juga dapat memilih tidak ikut API ini.

Anda dapat melihat informasi tentang topik yang diamati selama epoch saat ini dari halaman chrome://topics-internals.

Cara API menentukan pemanggil yang melihat topik

Pemanggil API hanya menerima topik yang baru-baru ini mereka amati, dan topik untuk pengguna diperbarui sekali setiap epoch. Artinya, API menyediakan periode berjalan yang memungkinkan pemanggil menerima topik tertentu.

Tabel di bawah menguraikan contoh (meskipun sangat kecil) dari histori penjelajahan fiktif untuk pengguna selama satu epoch, yang menampilkan topik yang terkait dengan situs yang mereka kunjungi, dan pemanggil API yang ada di setiap situs (entitas yang memanggil document.browsingTopics() dalam kode JavaScript yang disertakan di situs).

Situs Topik Pemanggil API di situs
yoga.example Kebugaran teknologi iklan1.contoh adtech2.contoh
knitting.example Kerajinan adtech1.example
contoh-contoh-perjalanan-perjalanan Kebugaran, Perjalanan & Transportasi adtech2.example
diy-clothing.example Kerajinan, Mode & Gaya [tak satu pun]

Pada akhir epoch (saat ini satu minggu) Topics API akan menghasilkan topik teratas browser untuk minggu ini.

  • adtech1.example kini memenuhi syarat untuk menerima "Kebugaran" dan "Kerajinan" topik, karena ia mengamatinya di yoga.example dan juga pada knitting.example.
  • adtech1.example tidak memenuhi syarat untuk menerima badge "Perjalanan & Transportasi" untuk pengguna ini karena tidak ada di situs mana pun yang baru-baru ini dikunjungi pengguna yang terkait dengan topik tersebut.
  • adtech2.example telah melihat "Kebugaran" dan "Perjalanan & Transportasi" topik, tetapi belum melihat "Kerajinan" topik.

Pengguna mengunjungi diy-clothing.example, yang memiliki daftar "Fashion & Gaya" topik, tetapi tidak ada panggilan ke Topics API di situs tersebut. Pada titik ini, ini berarti "Fashion & Gaya" topik tidak akan ditampilkan oleh API untuk pemanggil apa pun.

Pada minggu kedua, pengguna mengunjungi situs lain:

Situs Topik Pemanggil API di situs
sewing.example Kerajinan adtech2.example

Selain itu, kode dari adtech2.example ditambahkan ke diy-clothing.example:

Situs Topik Pemanggil API di situs
diy-clothing.example Kerajinan, Mode & Gaya adtech2.example

serta "Kebugaran" dan "Perjalanan & Transportasi" mulai minggu ke-1, ini berarti adtech2.example kini dapat menerima kategori "Crafts" dan "Fashion & Gaya" topic — tetapi tidak sampai epoch berikutnya, minggu ke-3. Dengan begitu, pihak ketiga tidak dapat mempelajari lebih lanjut masa lalu pengguna (dalam hal ini, minat terhadap mode) dibandingkan dengan cookie.

Setelah dua minggu lagi, "Kebugaran" dan "Perjalanan & Transportasi" dapat keluar dari daftar topik teknologi iklan2.example jika pengguna tidak membuka situs apa pun dengan topik tersebut yang menyertakan kode dari adtech2.example.

Kontrol pengguna, transparansi, dan ketidakikutsertaan

Pengguna harus dapat memahami tujuan Topics API, mengenali apa yang dikatakan tentang mereka, mengetahui kapan API tersebut digunakan, dan diberi kontrol untuk mengaktifkan atau menonaktifkannya.

Taksonomi API yang dapat dibaca manusia memungkinkan pengguna mempelajari dan mengontrol topik yang mungkin disarankan oleh browser mereka. Pengguna dapat menghapus topik yang secara khusus tidak ingin mereka bagikan kepada pengiklan atau penayang, dan terdapat kontrol untuk memberi tahu pengguna tentang API dan menunjukkan cara mengaktifkan atau menonaktifkannya. Chrome memberikan informasi dan setelan untuk Topics API di chrome://settings/adPrivacy. Selain itu, topik tidak tersedia untuk pemanggil API dalam mode Samaran, dan topik akan dihapus saat histori penjelajahan dihapus.

Daftar topik yang ditampilkan akan kosong jika:

  • Pengguna memilih tidak menggunakan Topics API melalui setelan browser di chrome://settings/adPrivacy.
  • Pengguna telah menghapus topiknya (melalui setelan browser di chrome://settings/adPrivacy) atau menghapus cookie mereka.
  • Browser dalam mode Samaran.

Penjelasan memberikan detail selengkapnya tentang sasaran privasi dan cara API berupaya mengatasinya.

Pilihan tidak ikut pada situs

Selain kemampuan pengguna untuk memilih tidak ikut, Anda dapat menonaktifkan Topics untuk situs atau halaman di dalamnya. Panduan developer akan menjelaskan caranya.

Menggunakan Topics API di situs dengan prebid.js

Seperti yang tercantum dalam rilis Prebid 7, komunitas secara aktif mengembangkan integrasi dengan Topics API melalui modul baru. Modul ini digabungkan pada Desember 2022.

Pelajari lebih lanjut di sini:

  • Baca dokumentasi modul Topics API Prebid.
  • Untuk informasi selengkapnya, hubungi Prebid.js melalui saluran standar apa pun yang mereka tawarkan.

Langkah berikutnya

Berinteraksi dan berbagi masukan