Klasyfikacja tematów

Przeczytaj, jak ustalane są tematy i jak są przypisywane do użytkowników i o tym, jak użytkownicy mogą kontrolować swoją listę tematów.

Stan implementacji

  • Interfejs Topics API został właśnie ukończony w fazie dyskusji publicznych i jest obecnie dostępny dla 99% użytkowników, skalowalny w zakresie 100%.
  • Aby przesłać opinię o interfejsie Topics API, zgłoś problem za pomocą wyjaśnienia Topics lub weź udział w dyskusjach w grupie o ulepszaniu reklam internetowych. Wyjaśnienie zawiera kilka pytań otwartych, które nadal wymagają doprecyzowania.
  • Oś czasu Piaskownicy prywatności zawiera ramy czasowe wdrożenia interfejsu Topics API i innych ofert pakietowych Piaskownicy prywatności.
  • Topics API: najnowsze aktualizacje – szczegółowe informacje o zmianach i ulepszeniach interfejsu Topics API oraz ich implementacjach.

Co to jest temat?

Temat w interfejsie Topics API to temat, który interesuje użytkownika. Jest to sygnalizowane przez odwiedzane witryny.

Tematy pomagają platformom z zakresu technologii reklamowych wybierać trafne reklamy. W przeciwieństwie do plików cookie innych firm informacje te są udostępniane bez ujawniania dodatkowych informacji o użytkowniku lub jego aktywności związanej z przeglądaniem.

Interfejs Topics API umożliwia firmom zewnętrznym, takim jak platformy technologii reklamowych, obserwowanie tematów interesujących użytkownika i otrzymywanie dostępu do nich. Na przykład interfejs API może zasugerować temat „Fiber & Tekstylia” w przypadku użytkownika, który odwiedza witrynę knitting.example.

Lista tematów używanych przez interfejs Topics API jest publiczna, wybrana przez człowieka, zrozumiała dla człowieka i zaprojektowana tak, aby uniknąć wyświetlania reklam o charakterze kontrowersyjnym. To aktualna lista, która będzie się z czasem poszerzać. Lista ma strukturę taksonomii. Tematy mogą być ogólne lub bardziej szczegółowe. Na przykład Food & Drink to szeroka kategoria z podkategorią Cooking & Recipes. Podkategorie można dalej dzielić na dodatkowe podkategorie.

Taka taksonomia tematów musi stanowić kompromis między użytecznością a prywatnością. Zbyt szczegółowe tematy mogą posłużyć do zidentyfikowania konkretnego użytkownika. Jeśli są zbyt ogólne, nie nadają się do wyboru reklam ani innych treści.

Systematyka tematów opiera się na 2 podstawowych wymaganiach:

  • Wspieraj reklamy oparte na zainteresowaniach
  • Dbaj o bezpieczeństwo użytkowników i chroń ich prywatność

Pojawia się kilka pytań. Na przykład:

  • W jaki sposób interfejs API może określać tematy interesujące użytkownika na podstawie jego aktywności związanej z przeglądaniem, a jednocześnie chronić jego prywatność?
  • Jak można uporządkować taksonomię, aby była bardziej przydatna?
  • Jakie konkretne elementy powinna uwzględniać taksonomia?

Jak interfejs API określa tematy dla witryny

Tematy są pobierane z modelu klasyfikatora, który mapuje nazwy hostów na 0 lub więcej tematów. Analizowanie dodatkowych informacji (takich jak pełne adresy URL czy zawartość strony) może zwiększyć trafność reklam, ale może też ograniczyć ochronę prywatności.

Model klasyfikatora mapowania nazw hostów na tematy jest dostępny publicznie, a jak wyjaśnia wyjaśnienie, można wyświetlać tematy witryny za pomocą narzędzi dla programistów w przeglądarce. Przewiduje się, że model będzie się z czasem ewoluować i ulepszać oraz będzie okresowo aktualizowany. jego częstotliwość jest wciąż rozważana.

Tylko witryny zawierające kod wywołujący interfejs Topics API są uwzględniane w historii przeglądania, które kwalifikują się do obliczania częstotliwości tematów, a użytkownicy wywołujący interfejs API otrzymują tylko obserwowane tematy. Innymi słowy, witryny nie kwalifikują się do obliczania częstotliwości tematów, jeśli witryna lub osadzona usługa nie wywołują interfejsu API.

Dodatkowo dzwoniący może odbierać tylko tematy, które zostały oznaczone jako „wykryte” przez jego kod. Jeśli więc kod innego rozmówcy zarejestrował temat, na przykład /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks, w przeglądarce użytkownika, a Twój kod nie spowodował zarejestrowania tego tematu w przeglądarce tego użytkownika, po wywołaniu interfejsu API z umieszczonego kodu nie będziesz w stanie poznać interesującego go tematu. Pamiętaj, że ponieważ interfejs API zawiera teraz elementy nadrzędne, które zaobserwowano, w przykładzie powyżej (/Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks) spowodowałoby również obserwowanie Autos & Vehicles i Motor Vehicles.

W zależności od witryny najwyższego poziomu tematy zwracane przez użytkownika są obliczane ponownie w przypadku osoby wywołującej. Jeśli na przykład adtech.example wyśle żądanie dotyczące tematów użytkownika w domenie news-a.example, następnie w dniu news-b.example, a następnie w dniu news-c.example, zwrócone tematy zostaną ponownie obliczone w każdej witrynie. Oznacza to, że rozmówca może otrzymywać różne tematy w różnych witrynach najwyższego poziomu, ponieważ (maksymalnie) 3 tematy zwrócone użytkownikowi są wybierane losowo z 5 pierwszych z trzech ostatnich epok (z 5% szansy na losowy temat). Utrudnia to rozmówcy identyfikowanie użytkownika według tematów, ponieważ prawdopodobnie są to różne witryny najwyższego poziomu (nawet dotyczące tego samego użytkownika, rozmówcy i epoki).

Model klasyfikatora

Tematy są ręcznie wybierane na podstawie 50 tys. głównych domen i wykorzystywana do trenowania klasyfikatora. Tę listę znajdziesz w narzędziu override_list.pb.gz, który jest dostępny na karcie Klasyfikator w bieżącym modelu (chrome://topics-internals/). Powiązania domeny z tematami na liście są używane przez interfejs API zamiast danych wyjściowych samego modelu.

Strona chrome://topics-internals z wybranym panelem klasyfikatora.
Panel klasyfikacji strony chrome://topics-internals zawiera wersję modelu, jego ścieżkę i tematy powiązane z każdym z wymienionych hostów.

Aby bezpośrednio uruchomić model, zapoznaj się z przewodnikiem po uruchamianiu modelu TensorFlow.

Aby sprawdzić plik override_list.pb.gz, najpierw go rozpakuj:

gunzip -c override_list.pb.gz > override_list.pb

Użyj narzędzia protoc, aby sprawdzić je pod postacią tekstu:

protoc --decode_raw < override_list.pb > output.txt

Pełna mapa kategorii z identyfikatorami jest dostępna na GitHubie.

Przekazywanie opinii lub danych wejściowych dotyczących modelu klasyfikatora

Opinie o interfejsie Topics API można przesyłać na kilka kanałów. Jeśli chcesz przesłać opinię o modelu klasyfikatora, zalecamy zgłoszenie problemu na GitHubie lub odpowiedź na istniejący problem. Na przykład:

Jak wybierane jest 5 najpopularniejszych tematów użytkownika

Interfejs API zwraca po 1 temacie na każdą epokę (maksymalnie 3). Jeśli zwracane są 3, obejmuje to tematy z bieżącej i poprzedniej epoki.

  1. Pod koniec każdej epoki przeglądarka kompiluje listę stron, które spełniają następujące kryteria:
    • Strona była odwiedzana przez użytkownika w tym okresie.
    • Strona zawiera kod wywołujący document.browsingTopics().
    • Interfejs API został włączony (np. nie został zablokowany przez użytkownika lub za pomocą nagłówka odpowiedzi).
  2. Przeglądarka na urządzeniu użytkownika używa modelu klasyfikatora dostarczonego przez interfejs Topics API, aby zmapować nazwę hosta każdej strony na listę tematów.
  3. Przeglądarka gromadzi listę tematów.
  4. Przeglądarka generuje listę 5 najpopularniejszych tematów według częstotliwości.

Następnie metoda document.browsingTopics() zwraca losowy temat z 5 pierwszych okresów dla każdej epoki z 5-procentowym prawdopodobieństwem, że którykolwiek z nich zostanie losowo wybrany z pełnej taksonomii tematów. W Chrome użytkownicy mogą też usuwać poszczególne tematy lub czyścić historię przeglądania, aby zmniejszyć liczbę tematów zwracanych przez interfejs API. Użytkownicy mogą też zrezygnować z korzystania z interfejsu API.

Na stronie chrome://topics-internals możesz wyświetlić informacje o tematach obserwowanych w bieżącej epoki.

Jak interfejs API decyduje, które elementy wywołujące widzą, które tematy

Osoby wywołujące interfejs API otrzymują tylko tematy, które ostatnio obserwowały, a tematy użytkownika są odświeżane co epokę. Oznacza to, że interfejs API wyświetla ciągłe okno, w którym dany obiekt wywołujący może otrzymywać określone tematy.

W tabeli poniżej znajdziesz przykład (choć nierealistycznie) hipotetyczną historię przeglądania użytkownika w jednej epoce, prezentującą tematy powiązane z odwiedzonymi przez niego stronami oraz elementy wywołujące interfejs API w każdej witrynie (czyli znajdujące się w niej elementy wywołujące document.browsingTopics() w kodzie JavaScript).

Witryna Tematy Elementy wywołujące interfejs API w witrynie
yoga.example Fitness adtech1.przykładowa reklamatechnologia2.przykład
knitting.example Rzemiosło adtech1.example
wakacje-turystyki.przykład Fitness, podróże i Transport adtech2.example
diy-clothing.example Rzemiosło, moda i Styl [brak]

Pod koniec epoki (obecnie jeden tydzień) interfejs Topics API generuje najpopularniejsze tematy tygodnia w przeglądarce.

  • adtech1.example może teraz otrzymać tytuł „Fitness” i „Rzemiosło” tematami, ponieważ obserwowano je na stronach joga.example oraz na drutach.example.
  • adtech1.example nie kwalifikuje się do otrzymania kolumny „Podróże i Transport” dla tego użytkownika, ponieważ nie występuje on w żadnych niedawno odwiedzonych przez niego witrynach powiązanych z tym tematem.
  • adtech2.example uzyskała ocenę „Fitness” oraz „Podróże Transport” tematów, ale nie widział „Rzemiosła” temat.

Użytkownik odwiedził stronę majsterkowanie.example, ze stroną „Moda i Styl" , ale nie było w niej żadnych wywołań interfejsu Topics API. W tym momencie oznacza to kategoria „Moda i i Styl" topic nie zostanie zwrócony przez interfejs API w przypadku żadnego elementu wywołującego.

W drugim tygodniu użytkownik odwiedza inną witrynę:

Witryna Tematy Elementy wywołujące interfejs API w witrynie
sewing.example Rzemiosło adtech2.example

Dodatkowo w witrynie adtech2.example zostanie dodany kod z adresu adtech2.example.

Witryna Tematy Elementy wywołujące interfejs API w witrynie
diy-clothing.example Rzemiosło, moda i Styl adtech2.example

A także „Fitness” oraz „Podróże Transport” od 1 tygodnia, oznacza to, że adtech2.example będzie mogła otrzymywać nagrody z kategorii „Rzemiosło” oraz „Moda i Styl" temat, ale dopiero w 3 tygodniu następującej epoki. Dzięki temu firmy zewnętrzne nie mogą dowiedzieć się więcej o przeszłości użytkownika (w tym przypadku o zainteresowaniu modą) niż informacje na temat plików cookie.

Po kolejnych 2 tygodniach „Fitness” oraz „Podróże Transport” może zostać usunięty z listy odpowiednich tematów na liście adtech2.example, jeśli użytkownik nie odwiedzi żadnych witryn zawierających te tematy, które zawierają kod z adtech2.example.

Ustawienia użytkowników, przejrzystość i rezygnacja

Użytkownicy powinni być w stanie zrozumieć przeznaczenie interfejsu Topics API, wiedzieć, co o nich mówi się o nim, wiedzieć, kiedy interfejs API jest używany, oraz mieć możliwość jego włączania i wyłączania.

Zrozumiała dla człowieka taksonomia interfejsu API umożliwia użytkownikom poznawanie i kontrolowanie tematów, które mogą zostać zasugerowane w przeglądarce. Użytkownicy mogą usuwać tematy, których nie chcą udostępniać przez interfejs Topics API reklamodawcom lub wydawcom. Dostępne są też opcje, które informują użytkownika o interfejsie i jak go włączyć lub wyłączyć. Chrome udostępnia informacje i ustawienia dotyczące interfejsu Topics API na stronie chrome://settings/adPrivacy. Dodatkowo tematy nie są dostępne dla wywołujących interfejs API w trybie incognito, a tematy są czyszczone po wyczyszczeniu historii przeglądania.

Lista zwracanych tematów będzie pusta, jeśli:

  • Użytkownik zrezygnuje z interfejsu Topics API w ustawieniach przeglądarki na stronie chrome://settings/adPrivacy.
  • Użytkownik wyczyścił swoje tematy (w ustawieniach przeglądarki na stronie chrome://settings/adPrivacy) lub wyczyścił pliki cookie.
  • Przeglądarka jest w trybie incognito.

Wyjaśnienie zawiera więcej informacji o celach związanych z prywatnością i o tym, w jaki sposób interfejs API dąży do ich realizacji.

Rezygnacja z witryny

Poza możliwością rezygnacji użytkownika można też zrezygnować z włączenia tematów w swojej witrynie lub na znajdujących się w niej stronach. Więcej informacji znajdziesz w przewodniku dla programistów.

Używanie interfejsu Topics API w witrynach z atrybutem prebid.js

Jak wspomnieliśmy w wersji Prebid 7, społeczność aktywnie stworzyła integrację z interfejsem Topics API za pomocą nowego modułu. Ten moduł został scalony w grudniu 2022 r.

Więcej informacji:

  • Przeczytaj dokumentację modułu Topics API w Prebid.
  • Aby uzyskać więcej informacji, skontaktuj się z Prebid.js za pomocą dowolnego dostępnego kanału standardowego.

Dalsze kroki

Angażuj i dziel się opiniami