Vendredi 3 juin 2022
Cette semaine, nous avons lancé une amélioration basée sur un algorithme qui identifie les documents dont l'élément de titre est écrit dans une langue ou un script différent de son contenu, et qui choisit un titre semblable à la langue et au script de ces documents. Cette approche repose sur le principe général selon lequel le titre d'un document doit être rédigé en fonction de la langue ou du script de son contenu principal. C'est l'une des raisons pour lesquelles les titres des résultats Web peuvent aller au-delà des éléments de titre classiques.
Titres multilingues
Les titres multilingues répètent la même expression avec deux langues ou scripts différents. La méthode la plus populaire consiste à ajouter une version anglaise au texte du titre d'origine.
गीतांजलि की जीवनी - Geetanjali Biography in Hindi
Dans cet exemple, le titre se compose de deux parties (séparées par un trait d'union), qui expriment le même contenu dans différentes langues (hindi et anglais). Bien que le titre soit rédigé dans les deux langues, le document lui-même est écrit en hindi uniquement. Notre système détecte ce type d'incohérence et peut n'utiliser que le texte du titre en hindi, par exemple :
गीतांजलि की जीवनी
Titres en latin
La translittération est utilisée lorsque le contenu d'une langue est traduit dans une autre langue qui utilise un script ou un alphabet différent. Prenons l'exemple d'un titre de page pour une chanson écrite en hindi, mais transcrite pour utiliser des caractères latins au lieu de l'écriture native dévanâgarienne en hindi :
jis desh me holi kheli jati hai
Dans ce cas, notre système essaie d'identifier un autre titre en utilisant le script qui prévaut sur la page. Par exemple :
जिस देश में होली खेली जाती है
Résumé
En général, nos systèmes utilisent l'élément de titre de la page. En cas de titres multilingues ou translittérés, nos systèmes peuvent rechercher des variantes correspondant à la langue principale de la page. C'est pourquoi nous vous recommandons de fournir un titre correspondant à la langue et/ou au script du contenu principal de la page.
N'hésitez pas à nous envoyer d'autres commentaires sur notre forum, y compris via les fils de discussion existants sur le sujet en anglais et en japonais.