Présentation de l'API Topics pour le Web

L'API Topics permet la publicité ciblée par centres d'intérêt sans avoir à suivre les sites consultés par l'utilisateur.

État de l'implémentation

Qu'est-ce que l'API Topics ?

L'API Topics est un mécanisme de Privacy Sandbox conçu pour préserver la confidentialité tout en permettant à un navigateur de partager des informations sur les centres d'intérêt d'un utilisateur avec des tiers. Il permet la publicité ciblée par centres d'intérêt sans avoir à suivre les sites consultés par l'utilisateur.

La publicité ciblée par centres d'intérêt est un concept clé de l'API Topics. Il s'agit d'une forme de publicité personnalisée qui consiste à sélectionner une annonce pour un utilisateur en fonction de ses centres d'intérêt, déduits des sites consultés récemment. La publicité contextuelle est différente de la publicité contextuelle, qui vise à faire correspondre les annonces au contenu de la page consultée par l'utilisateur.

La publicité ciblée par centres d'intérêt peut aider aussi bien les annonceurs (sites qui souhaitent promouvoir leurs produits ou services) que les éditeurs (sites qui utilisent des annonces pour monétiser leur contenu):

  • La publicité ciblée par centres d'intérêt peut aider les annonceurs à toucher des clients potentiels.
  • La publicité ciblée par centres d'intérêt peut compléter les informations contextuelles afin d'aider les éditeurs à utiliser la publicité pour financer leurs sites Web.

L'API Topics fournit une nouvelle forme de publicité ciblée par centres d'intérêt à l'aide de thèmes (catégories d'intérêt) attribués à un navigateur en fonction de l'activité récente de l'utilisateur. Ces thèmes peuvent compléter des informations contextuelles pour vous aider à sélectionner des publicités appropriées.

Fonctionnement

Auparavant, les cookies tiers et d'autres mécanismes étaient utilisés pour suivre le comportement de navigation des utilisateurs sur les sites afin d'identifier les sujets qui les intéressent. Ces mécanismes sont en cours d'abandon.

Avec l'API Topics, le navigateur observe et enregistre les sujets qui semblent intéresser l'utilisateur, en fonction de son activité de navigation. Ces informations sont enregistrées sur l'appareil de l'utilisateur. L'API Topics peut ensuite donner aux appelants de l'API (tels que les plates-formes ad tech) l'accès aux thèmes qui les intéressent, mais sans révéler d'informations supplémentaires sur leur activité de navigation.

Observation des sujets ancêtres

Depuis Chrome 114, lorsqu'un appelant observe un sujet pour un utilisateur sur une page, le navigateur considère également l'appelant comme ayant observé tous les ancêtres du sujet.

Par exemple, si le navigateur enregistre qu'un appelant observe Shopping/Apparel/Footwear/Boots pour un utilisateur, les ancêtres de ce sujet sont également considérés comme ayant été observés: Shopping/Apparel/Footwear, Shopping/Apparel et Shopping.

Auparavant, pour qu'un appelant soit considéré comme ayant observé Shopping/Apparel, par exemple, l'API devait renvoyer ce sujet spécifique. Cela signifie que si Shopping/Apparel est observé pour un appelant pour un utilisateur sur une page, et Shopping/Apparel/Footwear/Boots sur une autre, l'API traitera Shopping/Apparel comme ayant été observé sur les deux pages.

Époques

Bien entendu, l'API Topics doit veiller à ce que les thèmes qui l'intéressent soient à jour. Le navigateur déduit les thèmes d'un utilisateur en fonction de son activité de navigation au cours d'une période appelée epoch, actuellement une semaine. Chaque utilisateur a ses propres époques ("les époques sont par utilisateur"), et l'heure de début initiale est aléatoire. Le thème de chaque epoch est choisi de manière aléatoire parmi les cinq thèmes principaux associés à l'utilisateur pour cette période. Pour renforcer encore davantage la confidentialité et garantir que tous les thèmes peuvent être représentés, il y a 5% de chances qu'ils soient sélectionnés au hasard parmi tous les thèmes possibles d'une taxonomie de centres d'intérêt.

L'API Topics effectue trois tâches principales:

  • Mappez l'activité de navigation sur les centres d'intérêt. Dans la conception actuelle de l'API Topics, les thèmes sont déduits des noms d'hôte des pages consultées par l'utilisateur. Par exemple, le thème déduit pour un site Web consacré aux aquariums pourrait être /Animaux de compagnie et Animaux/Animaux de compagnie/Poissons et Aquaria
  • Calculez les principaux thèmes d'un utilisateur en fonction de son activité de navigation récente.
  • fournir des mécanismes permettant d'accéder aux sujets qui intéressent actuellement l'utilisateur afin de sélectionner les annonces appropriées ;

L'API Topics fournit des sujets lisibles par l'humain et facilement compréhensibles, ce qui permet de fournir des commandes pertinentes aux utilisateurs.

Comment les thèmes sont-ils organisés et sélectionnés ?

Les thèmes sont sélectionnés dans une taxonomie composée de catégories hiérarchiques telles que /Arts & Divertissement/Musique et Audio/Soul et R&B et /Business & Industrie/Agriculture et Sylviculture. Ces sujets ont été sélectionnés par Chrome pour les premiers tests, dans le but de faire de la taxonomie une ressource gérée par des contributeurs de confiance de l'écosystème. La classification doit être suffisamment limitée pour permettre à de nombreux utilisateurs navigateurs sont associés à chaque sujet. Actuellement, le nombre de thèmes est de 469, mais nous estimons que le nombre final de thèmes se situe entre quelques centaines et quelques milliers.

Pour éviter les catégories sensibles, les sujets doivent être publics, sélectionnés manuellement et rester à jour. La taxonomie initiale proposée pour les tests par Chrome a été élaborée manuellement afin d'exclure des catégories généralement considérées comme sensibles, telles que l'origine ethnique ou l'orientation sexuelle.

Pour les 50 000 sites les plus populaires, l'implémentation de l'API Topics dans Chrome utilise une liste de remplacement publique et sélectionnée manuellement pour mapper les noms d'hôte aux thèmes. Pour les autres sites, l'API Topics utilise un modèle de machine learning afin de déduire des thèmes à partir de noms d'hôte.

L'implémentation de l'API Topics dans Chrome entraîne le téléchargement d'un fichier TensorFlow Lite représentant le modèle. Celui-ci peut être utilisé en local sur l'appareil de l'utilisateur.

Vous pouvez accéder au fichier de modèle TensorFlow Lite et aux sujets inférés pour les noms d'hôte à partir de chrome://topics-internals.

Le schéma ci-dessous illustre un exemple simplifié montrant comment l'API Topics peut aider une plate-forme ad tech à sélectionner une annonce appropriée. Dans cet exemple, nous partons du principe que le navigateur de l'utilisateur dispose déjà d'un modèle permettant de mapper les noms d'hôte de sites Web aux sujets.

<ph type="x-smartling-placeholder">
</ph> <ph type="x-smartling-placeholder"></ph> Diagramme illustrant les étapes du cycle de vie de l&#39;API Topics, de la visite d&#39;un utilisateur à un site Web jusqu&#39;à l&#39;affichage d&#39;une annonce
Le schéma du cycle de vie de l'API Topics présente les étapes des actions de l'API d'un point de vue général.

Les appelants de l'API ne reçoivent que les thèmes qu'ils ont observés

L'un des objectifs de conception de l'API Topics est de permettre la publicité ciblée par centres d'intérêt sans partager d'informations avec plus d'entités qu'avec les cookies tiers. L'API Topics est conçue de sorte que les thèmes ne puissent être renvoyés que pour les appelants de l'API qui les ont déjà observés, dans un délai limité. On dit qu'un appelant d'API a observé un sujet pour un utilisateur s'il a appelé la méthode document.browsingTopics() dans le code inclus sur un site que l'API Topics a mappé sur ce sujet.

L'API ne renvoie que les thèmes observés par l'appelant au cours des trois dernières epochs. Cela permet d'éviter que les informations sur l'utilisateur soient partagées avec plus d'entités que les technologies remplacées par l'API (y compris les cookies tiers).

Le nombre de thèmes renvoyés dépend du nombre de thèmes que l'appelant de l'API a précédemment observés et du nombre de thèmes dont dispose l'utilisateur (par exemple, le nombre de semaines de données accumulées). N'importe quel thème peut être renvoyé, car un thème peut être indiqué pour chacune des trois époques récentes.

Pour en savoir plus sur l'utilisation et le test de l'API Topics, consultez le guide du développeur de l'API Topics.

Comment l'API réduit le fingerprinting

L'API Topics fournit plusieurs mécanismes pour s'assurer qu'il est difficile de restaurer l'identification d'un nombre important d'utilisateurs sur plusieurs sites en n'utilisant que l'API Topics:

  • Étant donné que la taxonomie des thèmes fournit des thèmes plus précis, chaque thème devrait compter un grand nombre d'utilisateurs. En fait, le nombre minimal d'utilisateurs par sujet est garanti, car dans 5% des cas, le sujet renvoyé est aléatoire.
  • Les sujets sont renvoyés de manière aléatoire parmi les cinq premiers thèmes de l'utilisateur.
  • Si un utilisateur visite fréquemment le même site (toutes les semaines, par exemple), le code exécuté sur celui-ci peut apprendre un nouveau sujet par semaine, au maximum.
  • Différents sites reçoivent différents thèmes pour le même utilisateur au cours de la même epoch. Il n'y a qu'une chance sur cinq que le sujet renvoyé pour un utilisateur d'un site corresponde à celui renvoyé pour lui sur un autre site. Il est alors plus difficile de déterminer s'il s'agit du même utilisateur.
  • Les sujets sont mis à jour pour un utilisateur une fois par semaine, ce qui limite la fréquence à laquelle les informations peuvent être partagées. En d'autres termes, l'API permet de limiter le fingerprinting en ne fournissant pas trop de mises à jour des sujets.
  • Un sujet ne sera renvoyé que si un appelant d'API a précédemment observé le même sujet pour le même utilisateur récemment. Cette approche permet de limiter le potentiel des entités d'apprendre (ou de partager) des informations sur les centres d'intérêt des utilisateurs qu'elles n'ont pas observées directement.

Comment l'API a répondu aux préoccupations concernant FLoC

La phase d'évaluation de FLoC en 2021 a reçu de nombreux commentaires de la part des contributeurs de technologies publicitaires et de l'écosystème Web. On s'inquiétait en particulier que les cohortes FLoC puissent être utilisées comme une surface de fingerprinting pour identifier les utilisateurs ou révéler leur lien avec une catégorie sensible. Nous avons également demandé à rendre le FLoC plus transparent et compréhensible pour les utilisateurs.

Nous avons tenu compte de ces commentaires pour concevoir l'API Topics. L'objectif est d'explorer d'autres façons de promouvoir la publicité ciblée par centres d'intérêt, avec une plus grande transparence, des garanties de confidentialité renforcées et une approche différente pour les catégories sensibles.

Étapes suivantes

En savoir plus sur les thèmes et leur fonctionnement

Si vous êtes développeur de technologies publicitaires, testez l'API Topics et participez. Pour obtenir des ressources plus détaillées, consultez le guide du développeur.

Interagir et partager des commentaires