Vendredi 17 septembre 2021
Le mois dernier, nous vous avons présenté notre nouveau système permettant de générer des titres des pages Web affichés dans les résultats. Grâce à vos commentaires, qui ont été très appréciés, nous avons encore amélioré notre système de titres. Découvrez plus en détail le travail effectué jusqu'à présent et des conseils supplémentaires destinés aux créateurs.
Les éléments de titre sont les plus utilisés
Comme nous l'avons expliqué dans notre dernier post, pour la grande majorité des pages Web figurant dans les résultats, le nouveau système utilise les éléments de titre HTML (parfois appelés balises de titre) comme titres des pages. Suite à vos commentaires, nous avons modifié notre système. Ainsi, les éléments de titre sont désormais utilisés dans 87 % des cas, contre 80 % environ auparavant.
Pourquoi ne pas utiliser les éléments de titre de façon systématique ? Depuis 2012, nous utilisons des informations qui ne figurent pas dans les éléments de titre lorsque nos systèmes déterminent que l'élément de titre ne décrit pas la page aussi bien qu'il le pourrait. Le titre de certaines pages est vide. Certains sites utilisent les mêmes titres sur chaque page, quel que soit leur contenu. Certaines pages ne comportent aucun élément de titre.
Exemples d'utilisation d'informations autres que les éléments de titre
Notre nouveau système est conçu pour s'adapter à d'autres situations dans lesquelles l'élément de titre ne suffit pas forcément. Voici quelques exemples d'informations détectées et prises en compte. Ils sont basés sur de réels problèmes constatés sur les milliards de pages figurant dans notre index.
Titres à moitié vides
Lorsque des sites volumineux utilisent des modèles pour générer les titres de leurs pages Web, mais que certaines informations sont manquantes, les titres peuvent être à moitié vides. Le modèle peut par exemple insérer un résumé de la page au début du titre, puis le nom du site. Dans les titres à moitié vides, le résumé est souvent manquant, ce qui génère des titres de ce type :
| Nom du site
Notre système est conçu pour détecter les titres à moitié vides et les ajuster en examinant les informations figurant dans les éléments d'en-tête ou dans d'autres phrases suffisamment longues et bien visibles sur la page. Le titre ainsi généré peut alors correspondre à l'intention réelle du site, par exemple :
Nom du produit | Nom du site
Titres obsolètes
Les titres obsolètes sont souvent dus à l'utilisation répétée d'une même page plusieurs fois par an pour des informations récurrentes, sans que l'élément de titre ne soit modifié pour prendre en compte la date la plus récente. Prenons l'exemple d'un élément de titre comme ceci :
Critères d'admission 2020 – Université des superhéros
Dans cet exemple, le titre désigne une page expliquant les modalités d'admission d'une université. La page comporte un grand titre bien visible ("Critères d'admission 2021"), mais pour une raison que nous ignorons, l'élément de titre n'a pas été modifié à la date actuelle. Notre système détecte cette incohérence et utilise la date correcte dans le titre pour indiquer ceci :
Critères d'admission 2021 – Université des superhéros
Titres imprécis
Parfois, les titres ne reflètent pas exactement le contenu d'une page. Par exemple, une page peut comporter du contenu dynamique avec un élément de titre comme :
Animaux en peluche géants, ours en peluche, ours polaires – Nom du site
Logiquement, les internautes s'attendent à ce que ces produits apparaissent sur la page. Toutefois, il s'agit d'un titre statique pour une page dont le contenu change de façon dynamique. Ces produits peuvent parfois apparaître, mais ce n'est pas toujours le cas.
Notre système tente de déterminer si le titre reflète correctement le contenu d'une page. S'il détermine que cela n'est pas le cas, il peut modifier le titre afin que l'utilisateur sache mieux à quoi s'attendre, comme ceci :
Animaux en peluche – Nom du site
Titres micro-récurrents
Les titres récurrents sont assez faciles à détecter. Le même titre s'affiche sur toutes les pages ou presque toutes les pages d'un site. Comme leur nom l'indique, les titres micro-récurrents correspondent aux éléments de titre répétés dans un sous-ensemble de pages d'un site. Notre système détecte ces cas de figure et les traite en conséquence, exactement comme les éléments de titre récurrents de façon générale.
Prenons l'exemple d'un forum de discussion consacré à des séries TV. Il peut comporter différentes sections portant sur telle ou telle série TV, puis des fils de discussion consacrés à chaque saison. Les éléments de titre micro-récurrents dans une section apparaissent sur les pages figurant sur les pages de chaque saison. Le titre n'indiquant pas le numéro de saison, il est difficile de déterminer à quelle saison correspond chaque page. Cette situation entraîne la présence de titres en double, par exemple :
Ma fantastique série TV
Ma fantastique série TV
Ma fantastique série TV
Notre système peut détecter le numéro de saison, s'il est indiqué dans un titre affiché en grand, et l'insérer dans les titres pour les rendre plus utiles :
Saison 1 - Ma fantastique série TV
Saison 2 - Ma fantastique série TV
Saison 3 - Ma fantastique série TV
Conseils destinés aux propriétaires de sites
En ce qui concerne les titres, nos principaux conseils destinés aux propriétaires de sites sont globalement les mêmes que sur notre page d'aide consacrée à ce sujet. Veillez avant tout à créer des éléments de titre HTML de qualité. Ce sont de loin les éléments que nous utilisons le plus.
Ensuite, étudiez bien les exemples figurant dans ce post pour déterminer si votre site présente les mêmes caractéristiques, qui pourraient inciter nos systèmes à examiner d'autres informations que vos éléments de titre. Les modifications que nous avons apportées visent principalement à atténuer des problèmes dont les créateurs n'ont pas forcément conscience. Suite aux modifications, votre élément de titre sera peut-être réutilisé, et c'est aussi ce que nous souhaitons.
Nous poursuivons nos actions pour améliorer les titres
Aucun système de création de titres n'est parfait. L'utilisation systématique des éléments de titre peut être problématique, comme nous l'avons indiqué ci-dessus. Toutefois, nous savons aussi que notre système de titres est perfectible. Vos commentaires nous ont été très utiles pour améliorer notre système. N'hésitez pas à nous envoyer d'autres commentaires sur notre forum, y compris via les fils de discussion existants sur le sujet en anglais et en japonais.