Themenklassifizierung

Hier erfahren Sie, wie Themen ermittelt werden, wie sie den Browsern der Nutzer zugewiesen werden und wie Nutzer ihre Themenliste verwalten können.

Implementierungsstatus

  • Die Topics API hat die öffentliche Diskussionsphase abgeschlossen und ist derzeit für 99 % der Nutzer verfügbar. Eine Skalierung auf bis zu 100 % ist möglich.
  • Wenn Sie Feedback zur Topics API geben möchten, können Sie in der Erläuterung zu Topics ein Problem erstellen oder in der Unternehmensgruppe zur Verbesserung der Webwerbung an Diskussionen teilnehmen. Sie enthält eine Reihe offener Fragen, die noch genauer definiert werden müssen.
  • Im Privacy Sandbox-Zeitplan finden Sie den Zeitplan für die Implementierung der Topics API und anderer Privacy Sandbox-Vorschläge.
  • Im Artikel Topics API: Neueste Updates finden Sie Informationen zu Änderungen und Verbesserungen der Topics API und deren Implementierungen.

Was ist ein Thema?

In der Topics API ist ein Thema ein Thema, für das sich ein Nutzer interessiert. Dies wird anhand der von ihm besuchten Websites ermittelt.

Themen sind ein Signal, mit dem AdTech-Plattformen relevante Anzeigen auswählen können. Im Gegensatz zu Drittanbieter-Cookies werden diese Informationen weitergegeben, ohne dass weitere Informationen über den Nutzer oder seine Browseraktivitäten offengelegt werden.

Mit der Topics API können Dritte, z. B. AdTech-Plattformen, Themen beobachten und darauf zugreifen, die für sie von Interesse sind. Beispielsweise könnte die API einem Nutzer, der die Website knitting.example besucht, das Thema „Textilkunst“ vorschlagen.

Die Liste der Themen, die von der Topics API verwendet wird, ist öffentlich, von Menschen ausgewählt, für Menschen lesbar und so konzipiert, dass sensible Kategorien vermieden werden. Dies ist die aktuelle Liste, die im Laufe der Zeit erweitert wird. Die Liste ist als Taxonomie strukturiert. Die Themen können übergeordnete oder spezifischere Themen umfassen. Beispiel: Food & Drink ist eine allgemeine Kategorie mit der Unterkategorie Cooking & Recipes. Unterkategorien können weiter in weitere Unterkategorien unterteilt werden.

Bei einer solchen Taxonomie der Themen muss ein Kompromiss zwischen Nutzen und Datenschutz hergestellt werden. Wenn Themen zu spezifisch sind, könnten sie verwendet werden, um einzelne Nutzende zu identifizieren. Wenn sie zu allgemein sind, sind sie nicht nützlich, um Werbung oder andere Inhalte auszuwählen.

Die Themen-Taxonomie wird mit zwei grundlegenden Anforderungen erstellt:

  • Interessenbezogene Werbung unterstützen
  • Nutzer schützen und ihre Privatsphäre schützen

Daraus lassen sich mehrere Fragen ableiten. Beispiel:

  • Wie kann die API am besten Themen, die sich für einen Nutzer interessieren, anhand seiner Browseraktivitäten ableiten, ohne den Datenschutz des Nutzers zu wahren?
  • Wie könnte die Taxonomie strukturiert werden, um sie nützlicher zu machen?
  • Welche Elemente sollte die Taxonomie enthalten?

Wie die API Themen für eine Website ableitet

Themen werden von einem Klassifizierungsmodell abgeleitet, das Website-Hostnamen null oder mehr Themen zuordnet. Die Analyse zusätzlicher Informationen (wie vollständige URLs oder Seiteninhalte) kann relevantere Anzeigen ermöglichen, aber auch den Datenschutz verringern.

Das Klassifikatormodell für die Zuordnung von Hostnamen zu Themen ist öffentlich verfügbar. Wie in der Erläuterung erwähnt, können die Themen für eine Website über die Entwicklertools des Browsers aufgerufen werden. Es ist davon auszugehen, dass das Modell im Laufe der Zeit weiterentwickelt und verbessert und regelmäßig aktualisiert wird. Die Häufigkeit dieser Änderung wird derzeit noch berücksichtigt.

Nur Websites mit Code zum Aufrufen der Topics API werden in den Browserverlauf einbezogen, der für die Berechnung der Häufigkeit von Themen infrage kommt. API-Aufrufer erhalten nur Themen, die sie beobachtet haben. Mit anderen Worten: Websites sind nicht für die Berechnung der Themenhäufigkeit geeignet, ohne dass die Website oder ein eingebetteter Dienst die API aufruft.

Außerdem kann ein Anrufer nur Themen erhalten, die sein Code "gesehen" hat. Wenn also durch den Code eines anderen Aufrufers ein Thema (z. B. /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks) für den Browser eines Nutzers registriert wurde und Ihr Code nicht dazu geführt hat, dass dieses Thema für den Browser dieses Nutzers registriert wurde, können Sie dieses Thema für den Browser dieses Nutzers nicht ermitteln, wenn Sie die API über Ihren eingebetteten Code aufrufen. Da die API nun auch Ancestors einschließt, so wie sie beobachtet wurden, würde das obige Beispiel /Autos & Vehicles/Motor Vehicles (By Type)/Hatchbacks ebenfalls dazu führen, dass Autos & Vehicles und Motor Vehicles beobachtet werden.

Für einen Nutzer zurückgegebene Themen werden für einen Aufrufer abhängig von der Website der obersten Ebene neu berechnet. Wenn adtech.example beispielsweise die Themen des Nutzers am news-a.example, am news-b.example und anschließend am news-c.example anfordert, werden die an ihn zurückgegebenen Themen auf jeder Website neu berechnet. Das bedeutet, dass ein Aufrufer wahrscheinlich unterschiedliche Themen für einen Nutzer auf verschiedenen Top-Level-Websites erhalten wird, da die (maximal) drei Themen, die für einen Nutzer zurückgegeben wurden, zufällig aus den fünf ersten Themen der letzten drei Epochen ausgewählt werden (mit einer Wahrscheinlichkeit von 5 %, dass ein zufälliges Thema ausgewählt wird). Das erschwert es einem Anrufer, einen Nutzer anhand seiner Themen zu identifizieren, da diese sich wahrscheinlich auf verschiedenen Websites der obersten Ebene unterscheiden (selbst für denselben Nutzer, denselben Aufrufer und dieselbe Epoche).

Das Klassifikatormodell

Die Themen werden manuell für 50.000 Top-Domains zusammengestellt. Anhand dieser Auswahl wird der Klassifikator trainiert. Sie finden diese Liste im override_list.pb.gz, das unter chrome://topics-internals/ nach dem aktuellen Modell auf dem Tab Klassifikator verfügbar ist. Die Verknüpfungen zwischen Domains und Themen in der Liste werden von der API anstelle der Ausgabe des Modells selbst verwendet.

Auf der Seite chrome://topics-internals ist das Steuerfeld „Klassifikator“ ausgewählt.
Im Bereich „Klassifikator“ auf der Seite chrome://topics-internals werden die Modellversion, ihr Pfad und die Themen angezeigt, die mit jedem aufgeführten Host verknüpft sind.

Informationen zum direkten Ausführen des Modells finden Sie in der TensorFlow-Anleitung zum Ausführen eines Modells.

Um die Datei override_list.pb.gz zu prüfen, entpacken Sie sie zuerst:

gunzip -c override_list.pb.gz > override_list.pb

Verwenden Sie protoc, um sie als Text zu prüfen:

protoc --decode_raw < override_list.pb > output.txt

Eine vollständige Taxonomie von Themen mit IDs ist auf GitHub verfügbar.

Feedback oder Input zum Klassifikatormodell geben

Es gibt mehrere Kanäle, über die Sie Feedback zur Topics API geben können. Wenn Sie Feedback zum Klassifikatormodell erhalten möchten, empfehlen wir Ihnen, ein GitHub-Problem zu melden oder auf ein vorhandenes Problem zu antworten. Beispiel:

Auswahl der fünf Top-Themen des Nutzers

Die API gibt bis zu drei Themen pro Epoche zurück. Wenn drei zurückgegeben werden, umfasst dies Themen der aktuellen und der beiden vorherigen Epochen.

  1. Am Ende jeder Epoche stellt der Browser eine Liste von Seiten zusammen, die folgende Kriterien erfüllen:
    • Die Seite wurde in dieser Epoche vom Nutzer besucht.
    • Die Seite enthält Code, der document.browsingTopics() aufruft.
    • Die API wurde aktiviert, z. B. nicht durch den Nutzer oder über einen Antwortheader.
  2. Der Browser auf dem Gerät des Nutzers verwendet das von der Topics API bereitgestellte Klassifikatormodell, um den Hostnamen für jede Seite einer Liste von Themen zuzuordnen.
  3. Der Browser sammelt die Liste der Themen.
  4. Der Browser erstellt eine Liste der fünf beliebtesten Themen, sortiert nach Häufigkeit.

Die Methode document.browsingTopics() gibt dann für jede Epoche ein zufälliges Thema aus den Top 5 mit einer Wahrscheinlichkeit von 5% zurück, dass eines dieser Themen nach dem Zufallsprinzip aus der vollständigen Thementaxonomie ausgewählt wird. In Chrome können Nutzer auch einzelne Themen entfernen oder ihren Browserverlauf löschen, um die Anzahl der von der API zurückgegebenen Themen zu reduzieren. Nutzer können die API auch deaktivieren.

Auf der Seite chrome://topics-internals können Sie Informationen zu Themen ansehen, die in der aktuellen Epoche beobachtet wurden.

Wie die API entscheidet, welche Aufrufer welche Themen sehen

API-Aufrufer erhalten nur Themen, die sie kürzlich beobachtet haben, und die Themen für einen Nutzer werden in jeder Epoche aktualisiert. Das bedeutet, dass die API ein rollierendes Zeitfenster bietet, in dem ein bestimmter Aufrufer bestimmte Themen empfangen kann.

Die folgende Tabelle enthält ein – wenn auch unrealistisch klein – Beispiel eines hypothetischen Browserverlaufs eines Nutzers während einer einzelnen Epoche. Sie enthält Themen im Zusammenhang mit den besuchten Websites und die API-Aufrufer, die auf jeder Website vorhanden sind (die Entitäten, die document.browsingTopics() in dem auf der Website enthaltenen JavaScript-Code aufrufen).

Website Themen API-Aufrufer auf Website
yoga.example Fitness adtech1.beispiel adtech2.beispiel
knitting.example Kunsthandwerk adtech1.example
wandern-urlaub.beispiel Fitness, Reisen und Verkehr adtech2.example
Bekleidung.beispiel.de Handwerk, Mode und Stil [Keine]

Am Ende der Epoche (derzeit eine Woche) generiert die Topics API die Topthemen der Woche im Browser.

  • adtech1.example kommt nun für die Themen „Fitness“ und „Handwerk“ infrage, da die Themen auf Yoga.example und strickting.example erfasst wurden.
  • „adtech1.example“ ist nicht berechtigt, das Thema „Reisen und Transport“ für diesen Nutzer zu empfangen, da es auf keiner Website vorhanden ist, die der Nutzer kürzlich besucht hat und mit diesem Thema verknüpft ist.
  • adtech2.example hat die Themen „Fitness“ und „Reisen und Transport“ gesehen, das Thema „Handwerk“ jedoch nicht.

Der Nutzer hat die Website diy-clothing.example mit dem Thema „Fashion & Style“ besucht, aber es gab auf dieser Website keine Aufrufe an die Topics API. An dieser Stelle bedeutet dies, dass das Thema "Fashion & Style" von der API für keinen Aufrufer zurückgegeben wird.

In Woche 2 besucht der Nutzer eine andere Website:

Website Themen API-Aufrufer auf Website
sewing.example Kunsthandwerk adtech2.example

Außerdem wird Code aus adtech2.example zu diy-clothing.example hinzugefügt:

Website Themen API-Aufrufer auf Website
Bekleidung.beispiel.de Handwerk, Mode und Stil adtech2.example

Neben „Fitness“ und „Reisen und Transport“ aus Woche 1 bedeutet dies, dass adtech2.example nun auch die Themen „Handwerk“ und „Mode & Stil“ erhalten kann. Dies gilt jedoch erst ab der darauffolgenden Epoche in Woche 3. So wird sichergestellt, dass Dritte nicht mehr über die Vergangenheit eines Nutzers (in diesem Fall ein Interesse an Mode) erfahren können als mit Cookies.

Nach weiteren zwei Wochen werden die Kategorien „Fitness“ und „Reisen und Transport“ möglicherweise aus der Liste der geeigneten Themen von adtech2.example entfernt, wenn der Nutzer keine Websites mit diesen Themen besucht, die Code von adtech2.example enthalten.

Nutzersteuerung, Transparenz und Deaktivierung

Nutzer sollten den Zweck der Topics API verstehen, erkennen können, was über sie gesagt wird, und wissen, wann die API verwendet wird, und Steuerelemente zum Aktivieren oder Deaktivieren der API erhalten.

Die für Menschen lesbare Taxonomie der API ermöglicht es Nutzern, mehr über die Themen zu erfahren und diese zu steuern, die ihnen von ihrem Browser vorgeschlagen werden. Nutzer können Themen entfernen, die die Topics API nicht für Werbetreibende oder Publisher freigeben soll. Außerdem können Nutzer über Steuerelemente über die API informiert werden und ihnen zeigen, wie sie aktiviert oder deaktiviert werden kann. Chrome stellt unter chrome://settings/adPrivacy Informationen und Einstellungen für die Topics API bereit. Außerdem sind Themen für API-Aufrufer im Inkognitomodus nicht verfügbar und Themen werden gelöscht, wenn der Browserverlauf gelöscht wird.

Die Liste der zurückgegebenen Themen ist in folgenden Fällen leer:

  • Der Nutzer deaktiviert die Topics API über die Browsereinstellungen unter chrome://settings/adPrivacy.
  • Der Nutzer hat seine Themen (über die Browsereinstellungen unter chrome://settings/adPrivacy) oder seine Cookies gelöscht.
  • Der Browser ist im Inkognitomodus.

Weitere Informationen zu Datenschutzzielen und dazu, wie die API diese erreichen soll

Website deaktivieren

Sie können die Topics API nicht nur für Ihre Website oder Ihre Seiten deaktivieren, sondern auch für Ihre Website oder die darin enthaltenen Seiten. Wie das geht, erfahren Sie im Entwicklerleitfaden.

Topics API auf Websites mit prebid.js verwenden

Wie in der Veröffentlichung von Prebid 7 erwähnt, entwickelte die Community aktiv über ein neues Modul eine Integration mit der Topics API. Dieses Modul wurde im Dezember 2022 zusammengeführt.

Weitere Informationen dazu findest du hier:

  • Weitere Informationen finden Sie in der Topics API-Moduldokumentation zu Prebid.
  • Wenn Sie weitere Informationen wünschen, wenden Sie sich über den Standardkanal des Anbieters an Prebid.js.

Nächste Schritte

Reagieren und Feedback geben