Martedì 3 dicembre 2024
Probabilmente avete sentito dire che la Ricerca Google deve fare un po' di lavoro prima che una pagina web possa essere visualizzata nei risultati della Ricerca Google. Uno di questi passaggi è chiamato scansione: la scansione per la Ricerca Google viene eseguita da Googlebot, un programma in esecuzione sui server di Google che recupera un URL e gestisce aspetti come errori di rete, reindirizzamenti e altre piccole complicazioni che potrebbero verificarsi nel percorso compiuto dall'URL sul web. Tuttavia, ci sono alcuni dettagli di cui non si parla spesso. Ogni settimana di questo mese esploreremo alcuni di questi aspetti specifici, in quanto potrebbero avere un effetto significativo sulla modalità di scansione dei vostri siti.
Facciamo un passo indietro: che cos'è la scansione?
La scansione è il processo di rilevamento di pagine web nuove e aggiornate e del loro download. In breve, Googlebot riceve un URL, invia una richiesta HTTP al server che lo ospita e poi gestisce la risposta del server, eventualmente seguendo i reindirizzamenti, gestendo gli errori e passando i contenuti della pagina al sistema di indicizzazione di Google.
Tuttavia, le pagine web moderne non contengono solo HTML puro, quindi che dire delle altre risorse che compongono una pagina? In che modo la scansione di queste risorse influisce sul "budget di scansione"? Queste risorse possono essere memorizzate nella cache da parte di Google? Esiste una differenza tra gli URL che non sono mai stati sottoposti a scansione e quelli già indicizzati? In questo post risponderemo a queste domande e ad altre ancora.
Googlebot e risorse delle pagine sottoposte a scansione
Oltre all'HTML, i siti web moderni utilizzano una combinazione di diverse tecnologie come JavaScript e CSS per offrire agli utenti esperienze vivaci e funzionalità utili. Quando accedete a queste pagine con un browser, questo scarica prima l'URL principale che ospita i dati necessari per iniziare a creare la pagina per l'utente, ovvero il codice HTML. Questi dati iniziali potrebbero contenere riferimenti a risorse come JavaScript e CSS, ma anche immagini e video che il browser scaricherà di nuovo per costruire la pagina finale che verrà poi presentata all'utente.
Google fa esattamente la stessa cosa, anche se in modo leggermente diverso:
- Googlebot scarica i dati iniziali dall'URL principale, ovvero il codice HTML della pagina.
- Googlebot trasmette i dati recuperati al servizio di rendering web (WRS).
- Utilizzando Googlebot, WRS scarica le risorse a cui fanno riferimento i dati originali.
- WRS costruisce la pagina utilizzando tutte le risorse scaricate come farebbe il browser di un utente.
Rispetto a un browser, il tempo tra ogni passaggio potrebbe essere notevolmente più lungo a causa di vincoli di pianificazione come il carico percepito del server che ospita le risorse necessarie per il rendering di una pagina; ed è qui che entra in gioco il budget di scansione.
La scansione delle risorse necessarie per il rendering di una pagina riduce il budget di scansione del nome host che ospita la risorsa. Per migliorare questo aspetto, WRS tenta di memorizzare nella cache ogni risorsa (JavaScript e CSS) a cui viene fatto riferimento nelle pagine di cui esegue il rendering. La durata (TTL) della cache WRS non è interessata dalle istruzione di memorizzazione nella cache HTTP. Al contrario, WRS memorizza nella cache tutto per un massimo di 30 giorni, il che contribuisce a preservare il budget di scansione del sito per altre attività di scansione.
Dal punto di vista dei proprietari di siti, la gestione di come e quali risorse vengono sottoposte a scansione può influire sul budget di scansione del sito. Vi consigliamo di:
- Utilizzare il minor numero possibile di risorse per offrire agli utenti un'ottima esperienza; meno risorse sono necessarie per il rendering di una pagina, meno budget di scansione viene speso durante questo processo.
- Utilizzare i parametri per il busting della cache con cautela; se gli URL delle risorse cambiano, Google potrebbe dover eseguire nuovamente la scansione delle risorse, anche se i relativi contenuti non sono cambiati. Ciò, ovviamente, comporterà un utilizzo del budget di scansione.
- Ospitare le risorse su un nome host diverso rispetto al sito principale, ad esempio utilizzando una CDN o semplicemente ospitando le risorse su un sottodominio diverso. In questo modo, i problemi relativi al budget di scansione verranno trasferiti all'host che pubblica le risorse.
Tutti questi punti si applicano anche alle risorse multimediali. Se Googlebot (o più specificamente Googlebot-Image
e Googlebot-Video
) le recupera, consumerà il budget di scansione del sito.
Potreste essere tentati di aggiungere anche robots.txt all'elenco, ma dal punto di vista del rendering la mancata autorizzazione della scansione delle risorse di solito causa problemi. Se WRS non riesce a recuperare una risorsa fondamentale per il rendering, la Ricerca Google potrebbe avere difficoltà a estrarre i contenuti della pagina e a consentirne il posizionamento nella Ricerca.
Che cos'è la scansione di Googlebot?
La fonte migliore per analizzare le risorse sottoposte a scansione da parte di Google è costituita dai log di accesso non elaborati del sito, che contengono una voce per ogni URL richiesto da browser e crawler. Per identificare i crawler di Google nel log di accesso, pubblichiamo i nostri intervalli IP nella documentazione per gli sviluppatori.
La seconda migliore risorsa è, ovviamente, il report Statistiche di scansione di Search Console, che suddivide ogni tipo di risorsa in base al crawler:

Infine, se volete approfondire questi argomenti e parlarne con altri utenti, la community di Search Central è il posto giusto per voi, ma potete trovarci anche su LinkedIn.
Aggiornamenti
- Aggiornamento del 6 dicembre 2024: è stato rilevato l'impatto sulle prestazioni della pubblicazione di risorse da un'origine diversa.
Vuoi saperne di più sulla scansione? Dai un'occhiata all'intera serie "Dicembre dedicato alla scansione":
Search Central Live arriva a New York
Giovedì 13 febbraio 2025 Siamo felici di annunciare che Search Central Live si terrà a New York per la prima volta il 20 marzo 2025. Il team della Ricerca Google ha organizzato diversi eventi qui, ma questa volta porteremo il nostro evento principale
Riepilogo di Search Central Live Kuala Lumpur e Taipei 2024
Venerdì 13 dicembre 2024 Gli eventi Search Central Live di Kuala Lumpur e Taipei sono stati davvero fantastici, in gran parte grazie alle oltre 600 persone che hanno partecipato. È stato grandioso vedere questo livello di entusiasmo e coinvolgimento
Unitevi a noi per Search Central Live a Zurigo!
Mercoledì 20 novembre 2024 Vi invitiamo a partecipare a Search Central Live Zurigo 2024 il 12 dicembre 2024 presso la sede di Google a Zurigo. Non vediamo l'ora di incontrarvi per una serie di presentazioni dei team che lavorano alla Ricerca Google.
È terminata Search Central Live a Giacarta e Bangkok 2024
Martedì 15 ottobre 2024 I nostri primi due eventi Search Central Live in Asia di quest'anno sono terminati e abbiamo esaminato ciò che abbiamo imparato e cosa possiamo fare meglio. Il 25 luglio 2024, siamo stati lieti di ospitare 335 persone a
Search Central Live 2024 torna nella regione APAC
Mercoledì 29 maggio 2024 Search Central Live sta tornando nella regione Asia Pacifico, offrendovi approfondimenti dalla Ricerca Google, divertenti opportunità di networking e altro ancora. Quest'anno intendiamo recarci in Indonesia, Malaysia, Taiwan
Search Central Live 2024 a Varsavia, in Polonia
Lunedì 25 marzo 2024 Siamo lieti di annunciare un evento Search Central Live a Varsavia, in Polonia, il 24 aprile 2024. Search Central Live è la nostra serie di eventi globali sulla Ricerca Google pensati appositamente per proprietari di siti,
Search Central Live 2024 a Bucarest, Romania
Lunedì 4 marzo 2024 Siamo lieti di annunciare un evento Search Central Live a Bucarest, in Romania, il 4 aprile 2024. Search Central Live è la nostra serie di eventi globali sulla Ricerca Google pensati appositamente per proprietari di siti,
Search Central Live Singapore 2023
Mercoledì 18 ottobre 2023 Siamo lieti di annunciare che Search Central Live Singapore torna quest'anno il 22 novembre. Come al solito, l'evento è ospitato dal team della Ricerca Google, e non vediamo l'ora di riunire la community per imparare,
Search Central Live Zurigo è tornato!
Venerdì 29 settembre 2023 Siamo felici di annunciare che Search Central Live tornerà a Zurigo martedì 24 ottobre 2023. Dopo il nostro ultimo evento Search Central Live tenutosi a Zurigo nel dicembre 2019, siamo di ritorno per altre presentazioni,
Search Central Live arriva in India
Giovedì 17 agosto 2023 Con tre eventi Search Central Live già portati a termine quest'anno, è giunto il momento di annunciare quello che ci viene chiesto con maggiore insistenza: Search Central Live India. Stiamo arrivando da voi in due location: Vi
Search Central Live a Tokyo e Giacarta: è stato un successo
Giovedì 27 luglio 2023 È passato circa un mese dalla conclusione di Search Central Live di Tokyo e circa due settimane da Search Central Live di Giacarta. Ripensare a questi eventi ci rende felici: è fantastico ritrovarci di presenza e incontrare
Il meglio del 2022 di Search Central Live
Venerdì 6 dicembre 2022 Abbiamo trascorso le ultime settimane impegnati ( ed entusiasti, ovviamente ) a organizzare gli eventi di Search Central Live a Singapore e Tel Aviv. Ci siete mancati dalla nostra ultima Webmaster Conference all'inizio del
Un grande ritorno: gli eventi di Search Central Live
Giovedì 13 ottobre 2022 Nel 2019 abbiamo organizzato gli eventi Webmaster Conference per proprietari di siti ed esperti SEO in più di 15 paesi, in particolare in regioni in cui in genere non vengono organizzate simili conferenze. Poi abbiamo dovuto
Search Central Live is returning to Brazil in 2025
Wednesday, January 15, 2025 We're excited to announce that Search Central Live is returning to São Paulo in 2025. Following our successful events in 2023 and 2024, we're continuing our mission to help Brazilian businesses enhance their site's
Search Central Live 2024 is coming to Kuala Lumpur and Taipei
Tuesday, Aug 27, 2024 As previously announced, Search Central Live is coming to Kuala Lumpur and to Taipei in the last quarter of 2024. And yes, we're very excited! What can you expect? A whole day of learning about Search while having some fun along
Search Central Live Bangkok 2024
Thursday, June 20, 2024 We're coming back to Thailand with Search Central Live! As mentioned in our blog post about our APAC plans for SCL, we now have a date and a site where you can sign up for a chance to secure your spot at Search Central Live
Announcing Search Central Live Argentina
Thursday, February 1, 2024 We're excited to announce that Search Central Live is coming to Buenos Aires on March 5, 2024. Following successful events throughout the world last year, we're continuing our mission to help website owners to enhance their
Search Central Live is returning to Brazil
Thursday, February 1, 2024 We're excited to announce that Search Central Live is returning to São Paulo. Following our successful events last year, we're continuing our mission to help Brazilian businesses enhance their site's performance in Google
Traditional Chinese Blog: Search Central Live Taipei 2023
Thursday, November 2, 2023 We are ecstatic to announce that for the first time ever, Search Central Live is coming to Taipei! Part of the Search Central Live events series, this is the first in-person event we are organizing in Taiwan, and we're
Announcing the Search Central Live Mexico roadshow
Wednesday, September 20, 2023 We're very excited to announce that Search Central Live is coming to Ciudad de México on November 7! Following successful events throughout the world earlier this year, we're continuing our mission to help you enhance
Indonesian Blog: Search Central Live Jakarta 2023
Wednesday, June 7, 2023 A few weeks back, we announced that Search Central Live is coming to a few locations in Asia Pacific throughout 2023. If you speak Indonesian fluently and are interested, Search Central Live Jakarta 2023 is happening on July
Search Central Live: Tokyo and future plans for APAC
Tuesday, May 16, 2023 Search Central Live is back in Asia Pacific throughout 2023 and we can’t wait to meet you in person! In November 2022 we resumed our search event series with SCL Singapore. Encouraged by the success of the event, we're now ready
Announcing the Search Central Live Brazil roadshow
Monday, February 6, 2023 We're very excited to announce that Search Central Live is coming to Brazil! Following our successful events last year, we're continuing our mission to help you enhance your site's performance in Google Search. We're