Googlebot będzie wkrótce rozumiał HTTP/2 na stronach

Czwartek, 17 września 2020 r.

W listopadzie 2020 roku Googlebot zacznie indeksować niektóre witryny przez HTTP/2.

Od czasu, gdy główne przeglądarki zaczęły obsługiwać kolejną główną wersję HTTP (HTTP/2, inaczej h2), specjaliści internetowi pytają, czy Googlebot może indeksować witryny przy użyciu zaktualizowanej, bardziej nowoczesnej wersji tego protokołu.

Informujemy, że od połowy listopada 2020 r. Googlebot będzie obsługiwać indeksowanie wybranych witryn przez HTTP/2.

Co to jest HTTP/2

Jak już wspomnieliśmy, jest to kolejna główna wersja protokołu HTTP, który jest używany przede wszystkim do przesyłania danych w internecie. Wersja HTTP/2 jest znacznie stabilniejsza, wydajniejsza i szybsza niż poprzednik ze względu na architekturę i funkcje dotyczące klientów (np. przeglądarki) oraz serwerów. Więcej informacji znajdziesz w długim artykule na temat HTTP/2.

Dlaczego wprowadzamy tę zmianę

Spodziewamy się, że ta zmiana pozwoli ograniczyć wykorzystanie zasobów serwerów podczas indeksowania. W przypadku protokołu h2 Googlebot zamiast korzystania z wielu połączeń może otworzyć jedno połączenie TCP z serwerem, aby sprawnie przesyłać wiele plików jednocześnie. Im mniej otwartych połączeń, tym mniej zasobów serwer i Googlebot muszą przeznaczyć na indeksowanie.

Jak to działa

Na pierwszym etapie zindeksujemy niewielką liczbę witryn przez protokół h2, a następnie będziemy stopniowo rozszerzać indeksowanie na kolejne witryny, które mogą odnieść korzyści z obsługiwanych na początku funkcji, takich jak multipleksowanie żądań.

Googlebot decyduje, czy witryna będzie indeksowana przez protokół h2, w zależności od tego, czy obsługuje ona h2 oraz czy indeksowanie przez HTTP/2 będzie korzystne dla Googlebota. Jeśli serwer obsługuje protokół h2, a Googlebot już indeksuje wiele elementów w Twojej witrynie, być może spełniasz kryteria przejścia na nowy rodzaj połączenia i nie musisz nic robić.

Jeśli serwer nadal obsługuje tylko protokół HTTP/1.1, nie ma problemu. Indeksowanie przez starszą wersję protokołu nie ma żadnych jednoznacznych wad w odniesieniu do jakości i ilości.

Jak zrezygnować

Nasze wstępne testy nie wykazały żadnych problemów ani negatywnego wpływu na indeksowanie. Rozumiemy jednak, że webmasterzy z różnych powodów mogą chcieć zrezygnować z indeksowania swoich witryn przez HTTP/2. Aby to zrobić, poinstruuj serwer, że na próby zindeksowania witryny przez protokół h2 ma odpowiadać Googlebotowi kodem stanu HTTP 421. Jeśli obecnie nie możesz tego zrobić, wyślij wiadomość do zespołu Googlebota (jest to tylko rozwiązanie tymczasowe).

Jeśli masz więcej pytań na temat Googlebota i HTTP/2, przeczytaj odpowiedzi na pytania, które warto zadać. Jeśli nie możesz znaleźć swojego pytania, skontaktuj się z nami na Twitterze i na forach pomocy.

Pytania, które warto zadać

Dlaczego uaktualniacie Googlebota?

Oprogramowanie, którego Googlebot używa do indeksowania stron przez protokół h2, jest już na tyle dojrzałe, że można z niego korzystać w środowisku produkcyjnym.

Czy muszę jak najszybciej uaktualnić mój serwer?

Wybór należy do Ciebie. Indeksowanie przez h2 włączymy jednak tylko w przypadku witryn, które obsługują ten protokół i odniosą korzyści z tej zmiany. Jeśli indeksowanie przez h2 nie niesie z sobą wyraźnych korzyści, Googlebot będzie nadal indeksował witrynę przez protokół h1.

Jak sprawdzić, czy witryna obsługuje protokół h2?

Na Cloudflare znajduje się post na blogu z opisem wielu różnych metod sprawdzania, czy strona obsługuje h2.

Jak uaktualnić protokół witryny do wersji h2?

To zależy od serwera. Zalecamy skontaktowanie się z administratorem serwera lub dostawcą usług hostingowych.

Jak przekonać Googlebota do używania h2 w komunikacji z witryną?

Nie można tego zrobić. Jeśli witryna obsługuje h2, może zostać zindeksowana przez ten protokół, ale tylko pod warunkiem, że będzie to korzystne dla witryny i Googlebota. Jeśli na przykład indeksowanie przez h2 nie spowodowałoby znacznego ograniczenia zużycia zasobów, witryna będzie nadal indeksowana przez HTTP/1.1.

Dlaczego nie indeksujecie wszystkich witryn z włączoną obsługą h2?

Podczas testów zauważyliśmy, że niektóre witryny (np. te z niską liczbą zapytań) nie odnoszą żadnych korzyści z indeksowania przez protokół h2. Dlatego postanowiliśmy, że indeksowanie przez h2 będzie włączane tylko wtedy, gdy przyniesie to wyraźne korzyści związane z witryną. Będziemy na bieżąco oceniać wzrost wydajności, a w przyszłości możemy zmienić kryteria przełączania protokołów.

Skąd wiadomo, że witryna jest indeksowana przez h2?

Gdy witryna zacznie spełniać kryteria dotyczące indeksowania przez h2, jej właściciele zarejestrowani w Search Console otrzymają komunikat z informacją, że od teraz część ruchu związanego z indeksowaniem może odbywać się przez protokół h2. Możesz też sprawdzić dzienniki serwera (na przykład plik access.log, jeśli witryna działa na serwerze Apache).

Które funkcje h2 są obsługiwane przez Googlebota?

Googlebot obsługuje większość funkcji wprowadzonych w wersji h2. Nadal testujemy niektóre funkcje, takie jak komunikaty push z serwera, które mogą być przydatne w przypadku renderowania.

Czy Googlebot obsługuje zwykły tekst HTTP/2 (h2c)?

Nie. Aby witrynę można było zindeksować przez HTTP/2, musi ona używać protokołu HTTPS i spełniać kryteria dotyczące indeksowania przez HTTP/2, tak jak ma to miejsce w przypadku nowoczesnych przeglądarek.

Czy Googlebot będzie używać rozszerzenia ALPN do wybierania wersji protokołu służącego do indeksowania?

Negocjowanie protokołu warstwy aplikacji (ALPN) będzie używane tylko w przypadku witryn, dla których włączono indeksowanie przez protokół h2, a jedyną akceptowaną odpowiedzią będzie „h2”. Jeśli podczas uzgadniania połączenia TLS serwer wyśle w odpowiedzi wersję protokołu inną niż h2, Googlebot zatrzyma operację i zindeksuje witrynę później przez protokół HTTP/1.1.

W jaki sposób różne funkcje h2 pomagają w indeksowaniu?

Oto niektóre z najważniejszych zalet protokołu h2:

  • Multipleksowanie i równoczesność: mniej otwartych połączeń TCP oznacza mniejsze wykorzystanie zasobów.
  • Kompresja nagłówków: znacznie mniejszy rozmiar nagłówków HTTP pozwala zaoszczędzić zasoby.
  • Komunikaty push z serwera: ta funkcja jest na etapie testów i nie została jeszcze włączona. Może ona być przydatna w przypadku renderowania, ale obecnie nie możemy podać żadnych szczegółowych informacji.

Jeśli chcesz dowiedzieć się więcej o konkretnych funkcjach h2 i ich związku z indeksowaniem, skontaktuj się z nami na Twitterze.

Czy w przypadku protokołu h2 Googlebot będzie indeksować więcej danych lub będzie działać szybciej?

Podstawową zaletą korzystania z h2 jest oszczędność zasobów zarówno po stronie serwera, jak i Googlebota. Wersja protokołu używanego do skanowania nie ma wpływu na sposób zindeksowana witryny, więc nie zmienia planowanej ilości indeksowanych danych.

Czy zindeksowanie witryny przez h2 może mieć korzystny wpływ na jej pozycję w rankingu?

Nie.