Che cos'è la canonicalizzazione
La canonicalizzazione è il processo di selezione dell'URL canonico rappresentativo di un contenuto. Di conseguenza, un URL canonico è l'URL di una pagina che Google ha scelto come più rappresentativo tra un insieme di pagine duplicate. Questa procedura, spesso chiamata deduplicazione, consente a Google di mostrare nei risultati di ricerca solo una versione dei contenuti, che altrimenti sarebbero duplicati.
Esistono molti motivi per cui un sito potrebbe avere contenuti duplicati:
- Varianti regionali: ad esempio, dei contenuti per Stati Uniti e Regno Unito, accessibili da URL diversi ma sostanzialmente sono gli stessi contenuti nella medesima lingua
- Varianti per dispositivi: ad esempio, una pagina con una versione mobile e una desktop
- Varianti di protocollo: ad esempio, le versioni HTTP e HTTPS di un sito
- Funzionalità del sito: ad esempio, i risultati delle funzionalità di ordinamento e filtraggio di una pagina di categoria
- Varianti accidentali: ad esempio, la versione demo del sito viene accidentalmente lasciata accessibile ai crawler
Alcuni contenuti duplicati su un sito sono normali e non costituiscono una violazione delle Norme di Google relative allo spam. Tuttavia, avere gli stessi contenuti accessibili tramite molti URL diversi può costituire un'esperienza utente negativa (ad esempio, le persone potrebbero chiedersi quale sia la pagina giusta e se esiste una differenza tra le due); inoltre, potrebbe essere più difficile per te tenere traccia del rendimento dei tuoi contenuti nei risultati di ricerca.
In che modo Google indicizza e sceglie l'URL canonico
Quando Google indicizza una pagina, determina i contenuti principali (o l'elemento centrale) di ogni pagina. Se Google trova più pagine che sembrano uguali o con contenuti principali molto simili, sceglie la pagina che, in base ai fattori (o agli indicatori) che il processo di indicizzazione ha raccolto, risulta oggettivamente la più completa e utile per gli utenti che eseguono ricerche; dopodiché, la contrassegna come canonica. La pagina canonica viene sottoposta a scansione con maggiore regolarità rispetto alle pagine duplicate, che vengono sottoposte a scansione meno frequentemente al fine di ridurre il carico di scansione sui siti.
Esistono diversi fattori che influenzano la canonicalizzazione: se la pagina viene pubblicata tramite HTTP o HTTPS, i reindirizzamenti, la presenza dell'URL in una Sitemap e le annotazioni link
rel="canonical"
. Puoi indicare la tua preferenza a Google tramite queste tecniche, ma Google, per vari motivi, potrebbe comunque scegliere come canonica una pagina diversa da quella che preferiresti tu. In altre parole, l'indicazione di una preferenza canonica è un suggerimento, non una regola.
Le versioni in diverse lingue di una stessa pagina vengono considerate pagine duplicate solo se i contenuti principali sono nella stessa lingua (ossia, se solo l'intestazione, il piè di pagina e altre parti testuali di secondaria importanza sono tradotte, mentre il testo principale resta lo stesso, allora le pagine vengono considerate duplicate). Per scoprire di più sulla configurazione dei siti localizzati, consulta la nostra documentazione sulla gestione dei siti multilingue e multiregionali.
Google utilizza la pagina canonica come fonte principale per valutare i contenuti e la qualità. In genere, un risultato della Ricerca Google rimanda alla pagina canonica, a meno che una delle pagine duplicate sia espressamente più adatta a un utente che esegue una ricerca. Ad esempio, il risultato di ricerca potrebbe reindirizzare a una pagina mobile se l'utente utilizza un dispositivo mobile, anche se la pagina canonica designata è quella desktop.
Scopri di più su come indicare la tua preferenza per l'URL canonico e se è necessario che tu la indichi.