Googlebot a breve parlerà in HTTP/2

Giovedì 17 settembre 2020

A partire da novembre 2020, Googlebot inizierà a eseguire la scansione di alcuni siti su HTTP/2.

Da quando i browser tradizionali hanno iniziato a supportare la nuova versione principale del protocollo HTTP, abbreviata in HTTP/2 o h2, i professionisti del Web ci hanno chiesto se Googlebot è in grado di eseguire la scansione sulla versione più aggiornata e moderna del protocollo.

Oggi annunciamo che, a partire da metà novembre 2020, Googlebot supporterà la scansione su HTTP/2 per determinati siti.

Che cos'è HTTP/2

Come abbiamo già detto, si tratta della nuova versione principale di HTTP, il protocollo più utilizzato da Internet per il trasferimento dei dati. HTTP/2 è molto più stabile, efficiente e veloce del suo predecessore, grazie all'architettura e alle funzionalità che implementa per i client (ad esempio il vostro browser) e per i server. Se volete saperne di più, abbiamo un lungo articolo sull'argomento HTTP/2.

Il motivo di questa modifica

In generale, ci aspettiamo che questo cambiamento renda la scansione più efficiente in termini di utilizzo delle risorse del server. Con h2, Googlebot può aprire una singola connessione TCP con il server e trasferire in modo efficiente più file su questo protocollo in parallelo, invece di richiedere più connessioni. Minore è il numero di connessioni aperte, minore è il numero di risorse che il server e Googlebot devono impiegare per la scansione.

Come funziona

Nella prima fase, eseguiremo la scansione di un numero limitato di siti su h2 e, in seguito, aggiungeremo gradualmente altri siti che potrebbero trarre vantaggio dalle funzionalità inizialmente supportate, come il multiplexing delle richieste.

Googlebot sceglie quali siti sottoporre a scansione su h2 tra quelli che supportano questo protocollo e quelli che trarrebbero beneficio assieme a Googlebot dalla scansione su HTTP/2. Se il server supporta h2 e Googlebot esegue già la scansione di molte pagine del vostro sito, questo potrebbe essere già idoneo all'upgrade della connessione; in tal caso, non dovete fare nulla.

Se il server comunica ancora solo tramite HTTP/1.1, non è un problema; eseguire la scansione tramite questo protocollo non comporta alcuno svantaggio specifico, dato che la qualità e la quantità della scansione rimarranno invariate.

Come disattivare la scansione con protocollo HTTP/2

I nostri test preliminari non hanno riscontrato problemi o un impatto negativo sull'indicizzazione, ma siamo consapevoli che, per vari motivi, potreste decidere di disattivare la scansione su HTTP/2 per il vostro sito. Per farlo, indicate al server di rispondere con un codice di stato HTTP 421 quando Googlebot tenta di eseguire la scansione del sito su h2. Se al momento ciò non vi è possibile, potete inviare un messaggio al team di Googlebot (anche se si tratta di una soluzione temporanea).

Per eventuali altre domande su Googlebot e HTTP/2, consultate la sezione Domande che potreste porvi. Se non trovate una risposta alla vostra domanda, scriveteci su Twitter e nei forum di assistenza.

Domande che potreste porvi

Perché Google sta eseguendo ora l'upgrade di Googlebot?

Il software utilizzato per consentire a Googlebot di eseguire la scansione su h2 è sufficientemente maturo da poter essere utilizzato in produzione.

Devo eseguire l'upgrade del mio server al più presto?

La scelta sta a voi. Tuttavia, passeremo alla scansione su h2 solo per i siti che lo supportano e ne avranno un chiaro beneficio. Se non esiste un vantaggio evidente per la scansione su h2, Googlebot continuerà comunque a eseguirla su h1.

Come faccio a verificare se il mio sito supporta h2?

Potete dare un'occhiata a un post del blog di Cloudflare dove sono descritti numerosi metodi diversi per verificare se un sito supporta h2.

Come faccio a eseguire l'upgrade del mio sito ad h2?

Dipende dal vostro server, pertanto vi consigliamo di rivolgervi all'amministratore del server o al provider host.

Come faccio a convincere Googlebot a comunicare tramite h2 con il mio sito?

Non si può fare. Se il sito supporta h2, significa che è idoneo per la scansione su h2, ma solo se ciò comporta un beneficio per il sito e per Googlebot. Se la scansione su h2 non porta, ad esempio, a notevoli risparmi in termini di risorse, continueremo semplicemente a eseguire la scansione del sito tramite HTTP/1.1.

Perché Google non esegue la scansione su h2 di tutti i siti che sono abilitati per tale protocollo?

Nelle nostre valutazioni abbiamo individuato un vantaggio minimo o nullo per determinati siti (ad esempio quelli con un valore QPS molto basso) quando la scansione viene eseguita su h2. Di conseguenza, abbiamo deciso di passare alla scansione tramite h2 solo quando c'è un chiaro beneficio per il sito. Continueremo a valutare i miglioramenti di prestazioni e in futuro potremmo modificare i nostri criteri per il passaggio.

Come faccio a sapere se il mio sito viene sottoposto a scansione su h2?

Quando un sito diventa idoneo per la scansione tramite h2, i proprietari di quel sito registrati in Search Console riceveranno un messaggio che li informa che da quel momento in poi una parte del traffico di scansione potrebbe avvenire su h2. Potete anche controllare i log del server (ad esempio nel file access.log, se il vostro sito utilizza Apache).

Quali funzionalità h2 sono supportate da Googlebot?

Googlebot supporta la maggior parte delle funzionalità introdotte dalla versione h2. Alcune funzionalità come il push del server, che possono essere utili per il rendering, sono ancora in fase di valutazione.

Googlebot supporta HTTP/2 di testo non crittografato (h2c)?

No, il vostro sito web deve utilizzare HTTPS e supportare HTTP/2 per essere idoneo alla scansione su HTTP/2. Ciò equivale a come i browser moderni gestiscono questi protocolli.

Googlebot utilizzerà l'estensione ALPN per decidere quale versione di protocollo utilizzare per la scansione?

La negoziazione del protocollo a livello di applicazione (ALPN) verrà utilizzata solo per i siti che hanno attivato la scansione su h2; l'unico protocollo accettato per le risposte sarà h2. Se il server risponde durante l'handshake TLS con una versione di protocollo diversa da h2, Googlebot si interromperà e tornerà in un secondo momento utilizzando HTTP/1.1.

In che modo le diverse funzionalità di h2 possono essere utili per la scansione?

I vantaggi di h2 sono numerosi, ma i più evidenti includono:

  • Multiplexing e contemporaneità: un minor numero di connessioni TCP aperte significa meno risorse utilizzate.
  • Compressione delle intestazioni: le dimensioni delle intestazioni HTTP ridotte consentono di risparmiare risorse.
  • Push del server: questa funzionalità non è ancora stata attivata ed è ancora in fase di valutazione. Potrebbe essere utile per il rendering, ma al momento non abbiamo ulteriori dettagli.

Per scoprire di più sulle specifiche funzionalità di h2 e sulla loro correlazione con la scansione, contattateci su Twitter.

Se si utilizza h2, la scansione di Googlebot migliora in termini di velocità o di volume?

Il vantaggio principale di h2 è il risparmio di risorse, sia sul lato server che per Googlebot. L'utilizzo di h1 o h2 per la scansione non influisce sulle modalità di indicizzazione di un sito e, di conseguenza, non influisce sulla frequenza di scansione del vostro sito da parte di Google.

Ci sono vantaggi per il ranking se la scansione di un sito viene eseguita su h2?

No, non vi è alcun vantaggio.