Venerdì 19 marzo 2010
Un sito web multilingue è un sito che offre i contenuti in più lingue. Un esempio potrebbe essere il sito di un'azienda canadese offerto nelle versioni inglese e francese oppure un blog sul calcio dell'America Latina disponibile in spagnolo e portoghese.
In genere, è consigliabile avere un sito web multilingue quando il vostro pubblico di destinazione è costituito da utenti di lingue diverse. Se il vostro blog sul calcio latinoamericano vuole raggiungere il pubblico brasiliano, potreste scegliere di pubblicarlo solo in portoghese. Tuttavia, se volete raggiungere anche gli appassionati di calcio in Argentina, i contenuti in spagnolo potrebbero aiutarvi.
Google e il riconoscimento della lingua
Google cerca di determinare le lingue principali di ciascuna delle vostre pagine. Potete contribuire a semplificare il riconoscimento della lingua se ne usate una sola per pagina ed evitate le traduzioni affiancate. Sebbene Google possa riconoscere una pagina in più lingue, consigliamo di utilizzare la stessa lingua per tutti gli elementi di una pagina: intestazioni, barre laterali, menu e così via.
Tenete presente che Google ignora tutte le informazioni relative alla lingua a livello di codice, dagli attributi "lang" alla definizione del tipo di documento (DTD). Alcuni programmi di editing web creano automaticamente questi attributi e quindi non sono molto affidabili quando si cerca di determinare la lingua di una pagina web.
Un utente che visita Google ed esegue una ricerca nella propria lingua si aspetta di trovare risultati di ricerca localizzati ed è qui che, come webmaster, entrate in gioco voi: se intendete localizzare un sito, rendetelo visibile nei risultati di ricerca con alcuni dei nostri suggerimenti di seguito.
Anatomia di un sito multilingue: struttura dell'URL
Non è necessario creare URL speciali durante lo sviluppo di un sito web multilingue; tuttavia, gli utenti potrebbero voler identificare in quale sezione del vostro sito web si trovano guardando semplicemente l'URL.
Ad esempio, i seguenti URL consentono agli utenti di sapere che si trovano nella sezione in inglese di questo sito:
https://example.ca/en/mountain-bikes.html
o
https://en.example.ca/mountain-bikes.html
. Questi altri URL consentono agli utenti di sapere che stanno visualizzando la stessa pagina in francese: https://example.ca/fr/mountain-bikes.html
o https://fr.example.ca/mountain-bikes.html
. Inoltre, questa struttura di URL semplificherà l'analisi dell'indicizzazione dei vostri contenuti multilingue.
Se volete creare URL con caratteri non inglesi, assicuratevi di utilizzare la codifica UTF-8. Gli URL codificati in UTF-8 devono contenere i caratteri di escape corretti quando vi si rimanda dai vostri contenuti. Se dovete eseguire l'escape manuale degli URL, potete trovare facilmente un codificatore URL online in grado di eseguire questa operazione. Ad esempio, se volessi tradurre il seguente URL dall'inglese al francese, https://example.ca/fr/mountain-bikes.html
, potrebbe avere il seguente aspetto: https://example.ca/fr/vélo-de-montagne.html
. Poiché questo URL contiene un carattere non inglese (é), verrebbero usati caratteri di escape per l'utilizzo in un link sulle vostre pagine: https://example.ca/fr/v%C3%A9lo-de-montagne.html
.
Scansione e indicizzazione del sito web multilingue
Vi consigliamo di non consentire l'indicizzazione delle traduzioni automatiche, dato che non hanno sempre senso e potrebbero essere viste come spam. E, cosa più importante, il punto di partenza per creare un sito web multilingue è raggiungere un pubblico più vasto fornendo contenuti utili in diverse lingue. Se gli utenti non riescono a comprendere una traduzione automatica o se hanno l'impressione che sia artificiale, chiedetevi se volete davvero presentare questo tipo di contenuti.
Se intendete localizzare il sito, fate in modo che Googlebot esegua facilmente la scansione delle versioni in tutte le lingue del vostro sito. Valutate la possibilità di collegare tra loro le pagine. In altre parole, potete fornire link tra pagine con gli stessi contenuti in lingue diverse, il che può essere molto utile anche per gli utenti.
Seguendo l'esempio precedente, supponiamo che un madrelingua francese venga reindirizzato su
https://example.ca/en/mountain-bikes.html
; con un solo clic può raggiungere https://example.ca/fr/vélo-de-montagne.html
, dove può visualizzare gli stessi contenuti in francese.
Per semplificare la scansione di tutti i contenuti del sito, evitate reindirizzamenti automatici in base alla lingua percepita dell'utente. Questi reindirizzamenti potrebbero impedire agli utenti (e ai motori di ricerca) di visualizzare tutte le versioni del sito.
Infine, tenete i contenuti per ogni lingua su URL separati: non usate cookie per mostrare le versioni tradotte.
Utilizzare le codifiche dei caratteri
Google estrae direttamente le codifiche dei caratteri da intestazioni HTTP, intestazioni di pagina HTML e contenuti. Non è necessario fare nulla per la codifica dei caratteri, tranne controllare le informazioni in conflitto, ad esempio tra i contenuti e le intestazioni. Google può riconoscere diverse codifiche dei caratteri, ma vi consigliamo di utilizzare UTF-8 sul vostro sito web ogni volta che è possibile.
Se vi si è arrotolata la lingua…
Ora che sapete tutto questo, la vostra lingua potrebbe arrotolarsi quando parlate molte lingue diverse, ma questo non deve capitare anche al vostro sito web.
Per saperne di più, consultate il nostro post sui siti multiregionali e continuate a seguirci per non perdervi il prossimo post, in cui discuteremo di situazioni speciali che potrebbero presentarsi quando lavorate con siti web globali. Fino ad allora, non esitate a visitare il forum di assistenza e a unirvi alla discussione.