Cómo genera Google títulos en documentos con discrepancias de idioma o alfabeto

Viernes, 3 de junio del 2022

Esta semana, presentamos una mejora algorítmica que identifica los documentos en los que el elemento de título está escrito en un idioma o alfabeto distinto del de su contenido, y elige un título que sea acorde al idioma y alfabeto del documento. Esta mejora se basa en el principio general de que el título de un documento debe estar escrito en el mismo idioma o alfabeto que el contenido principal. Este es uno de los motivos por los que podemos buscar alternativas a los elementos de título a la hora de presentar títulos en los resultados web.

Títulos multilingües

Los títulos multilingües repiten la misma frase en dos idiomas o alfabetos diferentes. El patrón más habitual es añadir una versión en inglés al texto del título en el idioma original.

गीतांजलि की जीवनी - Geetanjali Biography in Hindi

En este ejemplo, el título está formado por dos partes (divididas por un guion) que representan el mismo contenido en diferentes idiomas (hindi e inglés). Aunque el título está en ambos idiomas, el documento solo está escrito en hindi. Nuestro sistema detecta esa incoherencia y puede que solo utilice el texto del título en hindi, así:

गीतांजलि की जीवनी

Títulos con alfabeto latino

Transliteración es el método de representar el contenido de un idioma con un alfabeto diferente. Por ejemplo, pongamos que el título de una página es una canción escrita en hindi, pero que se ha transcrito con caracteres latinos en lugar de usar el alfabeto devanagari propio del hindi:

jis desh me holi kheli jati hai

En ese caso, nuestro sistema intenta encontrar un título alternativo que use el alfabeto que predomina en la página, que en este caso podría ser:

जिस देश में होली खेली जाती है

Resumen

En general, nuestros sistemas suelen utilizar el elemento de título de la página. Sin embargo, si hay títulos en varios idiomas o transliterados, nuestros sistemas pueden buscar alternativas que coincidan con el idioma predominante de la página. Por este motivo, te recomendamos que uses un título que coincida con el idioma y el alfabeto del contenido principal de la página.

No dudes en dejar nuevos comentarios en nuestro foro, también en las conversaciones que ya hay sobre este tema (en inglés y en japonés).