Googlebot utilisera bientôt HTTP/2

Jeudi 17 septembre 2020

À partir de novembre 2020, Googlebot commencera à explorer certains sites via HTTP/2.

Depuis que les navigateurs grand public ont commencé à accepter la prochaine révision majeure du protocole HTTP, HTTP/2 ou h2, les internautes nous ont demandé si Googlebot pouvait explorer leurs pages avec ce nouveau protocole, plus moderne.

Nous annonçons aujourd'hui qu'à compter de la mi-novembre 2020, Googlebot acceptera l'exploration des pages via HTTP/2 pour certains sites.

Qu'est-ce que le protocole HTTP/2 ?

Comme nous l'avons dit, il s'agit de la prochaine version majeure de HTTP, le protocole principalement utilisé par Internet pour le transfert des données. HTTP/2 est beaucoup plus robuste, efficace et rapide que son prédécesseur, en raison de son architecture et des fonctionnalités qu'il présente pour les clients (votre navigateur, par exemple) et pour les serveurs. Si vous souhaitez en savoir plus à ce sujet, nous avons rédigé un long article sur le protocole HTTP/2.

Raisons de ce changement

D'une manière générale, ce changement devrait améliorer l'efficacité de l'exploration en ce qui concerne l'utilisation des ressources du serveur. Grâce à h2, Googlebot peut ouvrir une seule connexion TCP sur le serveur et y transférer efficacement plusieurs fichiers simultanément, au lieu de nécessiter plusieurs connexions. Plus le nombre de connexions est faible, moins le serveur et Googlebot doivent consacrer de ressources à l'exploration.

Fonctionnement

Dans un premier temps, nous explorerons un nombre limité de sites via le protocole h2. Puis, nous étendrons progressivement le nombre de sites pouvant bénéficier des fonctionnalités initialement acceptées, telles que le multiplexage des requêtes.

Googlebot déterminera les sites à explorer sur h2 en fonction de leur compatibilité avec ce protocole, et selon que le site et Googlebot ont intérêt à utiliser l'exploration via HTTP/2. Si votre serveur est compatible avec le protocole h2 et que Googlebot explore déjà de nombreuses de vos pages, vous êtes peut-être déjà éligible pour cette mise à niveau. Aucune action n'est requise de votre part.

Si votre serveur ne communique qu'avec le protocole HTTP/1.1, ce n'est pas un problème. L'exploration via ce protocole ne présente pas d'inconvénient explicite. Elle reste la même en termes de qualité et de quantité.

Que faire si vous ne souhaitez pas participer ?

Nos tests préliminaires n'ont montré aucun problème ni aucun impact négatif sur l'indexation, mais nous comprenons que, pour diverses raisons, vous ne souhaitiez pas que votre site soit exploré via HTTP/2. Pour ce faire, demandez au serveur de répondre avec un code d'état HTTP 421 lorsque Googlebot tentera d'explorer votre site via le protocole h2. Si cela n'est pas possible pour le moment, vous pouvez envoyer un message à l'équipe Googlebot (cette solution est toutefois temporaire).

Si vous avez d'autres questions sur Googlebot et HTTP/2, consultez cette section. Si vous n'y trouvez pas la réponse à votre question, écrivez-nous sur Twitter ou sur les forums d'aide.

Questions que vous vous posez peut-être

Pourquoi mettez-vous à niveau Googlebot maintenant ?

Le logiciel que nous utilisons pour permettre à Googlebot d'explorer les pages via h2 est suffisamment mature pour être utilisé en production.

Dois-je mettre à niveau mon serveur dès que possible ?

Ce choix vous appartient. Cependant, nous n'appliquerons l'exploration via le protocole h2 que sur les sites compatibles auxquels cela peut profiter. Si l'exploration via h2 ne présente aucun avantage évident sur un site quelconque, Googlebot continuera à l'explorer avec le protocole h1.

Comment puis-je vérifier si mon site est compatible avec le protocole h2 ?

Cloudflare propose un article de blog avec de nombreuses méthodes permettant de tester si un site est compatible avec h2. Consultez-le !

Comment mettre à niveau mon site pour qu'il soit exploré via le protocole h2 ?

Cela dépend de votre serveur. Nous vous recommandons de contacter votre administrateur de serveur ou votre fournisseur d'hébergement.

Comment puis-je convaincre Googlebot d'utiliser h2 avec mon site ?

Cela n'est pas possible. Si le site accepte le protocole h2, il pourra être exploré via ce protocole, mais seulement si cela présente un réel avantage pour le site lui-même et pour Googlebot. Si l'exploration via h2 n'entraîne pas d'économies de ressources notables, nous continuerons simplement d'explorer le site via HTTP/1.1.

Pourquoi n'explorez-vous pas tous les sites qui sont compatibles avec le protocole h2 ?

Lors de nos tests, nous avons observé que l'exploration avec le protocole h2 présentait peu, voire pas d'avantages, pour certains sites (par exemple, ceux dont le nombre de requêtes par seconde est très faible). C'est pourquoi nous avons décidé de n'appliquer l'exploration via h2 que lorsque cela présente des avantages évidents pour le site. Nous continuerons à évaluer les gains de performances et à ajuster nos critères de migration à l'avenir.

Comment savoir si mon site est exploré via le protocole h2 ?

Lorsqu'un site peut être exploré via le protocole h2, ses propriétaires reçoivent, dans la Search Console, un message leur indiquant qu'une partie du trafic d'exploration pourra s'effectuer via ce protocole. Vous pouvez également consulter les journaux de votre serveur (par exemple, dans le fichier access.log si votre site est exécuté sur Apache).

Quelles sont les fonctionnalités h2 compatibles avec Googlebot ?

Googlebot est compatible avec la plupart des fonctionnalités introduites par h2. Certaines fonctionnalités, telles que server push, qui peut présenter des avantages pour l'affichage, sont encore en cours d'évaluation.

Googlebot est-il compatible avec le protocole HTTP/2 en texte brut (h2c) ?

Non. Votre site Web doit utiliser HTTPS et doit être compatible avec HTTP/2 pour pouvoir être exploré via HTTP/2. Cette pratique équivaut à la manière dont les navigateurs récents gèrent cette fonctionnalité.

L'extension ALPN sera-t-elle utilisée par Googlebot pour déterminer la version de protocole à choisir pour l'exploration ?

Le protocole ALPN ne sera utilisé que pour les sites qui ont activé l'exploration via h2. Le seul protocole accepté pour les réponses sera le protocole h2. Si le serveur répond lors du handshake TLS avec une version de protocole autre que h2, Googlebot reviendra en arrière et recommencera à utiliser HTTP/1.1.

En quoi les différentes fonctionnalités du protocole h2 facilitent-elles l'exploration ?

Voici quelques-uns des nombreux avantages du protocole h2 :

  • Multiplexage et simultanéité : moins de connexions TCP ouvertes équivalent à moins de ressources consommées.
  • Compression d'en-têtes : la réduction significative de la taille des en-têtes HTTP permet d'économiser les ressources.
  • Server push : cette fonctionnalité n'est pas encore activée. Elle reste en phase d'évaluation. Bien qu'elle puisse être utile pour l'affichage, nous n'avons aucune information précise à apporter à ce sujet à ce stade.

Si vous souhaitez en savoir plus sur des fonctionnalités spécifiques du protocole h2 et sur leur rapport avec l'exploration, contactez-nous sur Twitter.

L'exploration de Googlebot via le protocole h2 est-elle plus performante ?

Le principal avantage du protocole h2 est l'économie de ressources, du côté du serveur et du côté de Googlebot. Le fait que nous explorions le contenu à l'aide du protocole h1 ou h2 n'a aucune incidence sur la manière dont votre site est exploré et indexé.

L'exploration d'un site avec le protocole h2 permet-elle d'améliorer son classement ?

Non.