Como o Google gera títulos para documentos com desalinhamento de idioma ou script

Sexta-feira, 3 de junho de 2022

Esta semana, apresentamos uma melhoria algorítmica que identifica documentos em que o elemento de título está escrito em um idioma ou script diferente e escolhe um título semelhante ao conteúdo do documento. Isso se baseia no princípio geral de que o título de um documento precisa estar no idioma ou script do conteúdo principal. É por isso que podemos ir além dos elementos de título para os resultados da Web.

Títulos multilíngues

Títulos multilíngues repetem a mesma frase com dois idiomas ou scripts diferentes. O padrão mais comum é anexar uma versão em inglês ao texto do título original.

गीतांजलि की जीवनी - Biografia de Geetanjali em hindi

Neste exemplo, o título consiste em duas partes (divididas por um hífen), e elas expressam o mesmo conteúdo em diferentes idiomas, hindi e português. Embora o título esteja nos dois idiomas, o documento em si está apenas em hindi. Nosso sistema detecta essa inconsistência e talvez use somente o título em hindi, como o seguinte:

गीतांजलि की जीवनी

Títulos com alfabeto latino

A transliteração ocorre quando o conteúdo é escrito de um idioma para outro que usa um script ou alfabeto diferente. Por exemplo, considere o título de uma página com uma música escrita em hindi, mas transliterada para caracteres latinos em vez do script nativo devanágari de hindi:

jis desh me holi kheli jati hai

Nosso sistema tenta encontrar um título alternativo usando o script predominante na página, que, nesse caso, pode ser este:

जिस देश में होली खेली जाती है

Resumo

Em geral, nossos sistemas tendem a usar o elemento título da página. Em casos de títulos transliterados ou multilíngues, nossos sistemas podem buscar alternativas que correspondam ao idioma predominante da página. Por isso, recomendamos fornecer um título que corresponda ao idioma e/ou ao script do conteúdo principal da página.

Envie mais feedback no nosso fórum, incluindo nas conversas sobre o tópico em inglês e japonês.