Compensar expansões, interpretações e otimizações padrão

O Google Cloud Search tem várias expansões, interpretações e otimizações padrão que afetam os resultados da pesquisa. Caso você veja resultados inesperados em consultas de pesquisa, consulte este guia antes de entrar em contato com o suporte do Cloud Search.

Expansões padrão

Suponha que um usuário esteja pesquisando usando uma string, como [PDFs do João], mas alguns resultados retornados contêm palavras destacadas, como "documentos", em vez de "PDFs". Por que os resultados contêm as palavras destacadas que não estavam na consulta de pesquisa?

Por padrão, o Google Cloud Search, assim como o Google Web Search, não pesquisa apenas as palavras exatas de uma consulta. Em vez disso, o Cloud Search expande a consulta para incluir sinônimos e variações de palavras, mesmo que você não tenha implementado os próprios sinônimos. Essa expansão é feita para recuperar documentos que correspondam amplamente à ideia e à intenção da consulta. Depois que esse amplo conjunto de documentos é selecionado, os algoritmos de classificação trabalham para garantir que as melhores correspondências sejam colocadas na parte superior do conjunto de resultados.

Quando o usuário pesquisou [PDFs do João], o Cloud Search forneceu as seguintes palavras como outras palavras aceitáveis:

  • Para [João], o Cloud Search também pode corresponder a "joe" (uma expansão de stem) e "joes" (um sinônimo baseado em pontuação).
  • Para [PDFs], o Cloud Search também pode corresponder a "documentos" (uma expansão de sinônimo) e "pdf" (uma expansão de radical).

Por padrão, os sinônimos não são necessariamente bidirecionais. Por exemplo, se um usuário pesquisar o termo "phishing", o Cloud Search poderá corresponder "phish" como uma expansão de sinônimo. No entanto, se o usuário pesquisar o termo "phish", o Google talvez não corresponda a "phishing" como uma expansão.

Expansões para palavras com e sem hífen

Quando o usuário pesquisa palavras com hífen em vez de equivalentes sem hífen, como [walk-in closet] e [walk in closet], o Cloud Search trata essas consultas de maneira diferente.

Além disso, otimizações diferentes são usadas para palavras com hífen e sublinhado, como [passeio] e [passeio_in].

Compensar por expansões padrão

Por padrão, não há garantia de expansão. Se você quiser garantir a bidirecionalidade de sinônimos ou expansões de sinônimos específicos do domínio, crie seu próprio conjunto de sinônimos específicos do domínio. Para mais informações sobre a implementação de sinônimos, consulte Definir sinônimos.

Interpretações padrão

O Cloud Search também oferece interpretação de linguagem natural que interpreta os objetos, as propriedades e os valores de campo usados em uma consulta de acordo com o esquema enviado para uma determinada fonte de dados. Para mais informações sobre essa interpretação de linguagem natural, consulte Estruturar seu esquema para a interpretação ideal de consultas.

Desativar interpretações de linguagem natural

Para desativar interpretações de linguagem natural para uma consulta específica, defina QueryInterpretationOptions.disableNlInterpretation como true na solicitação de pesquisa.

Otimizações padrão

O Cloud Search também oferece estas otimizações padrão:

  • Combinação dos resultados fornecidos pela correção ortográfica. Por exemplo, se a string da consulta fosse [corporar benefícios], o Cloud Search corresponderia à grafia correta de "corporativo" e "corporativo".

  • Para consultas que teriam zero ou poucos resultados, o Cloud Search usa um conjunto mais permissivo de termos relacionados, mais amplo do que sinônimos diretos, para fazer a correspondência dos resultados. Para mais informações, consulte Processar resultados complementares.

Normalização de documentos e consultas

Normalização refere-se à padronização de certas palavras ou frases antes ou depois de uma consulta ser feita. Para garantir respostas mais consistentes às suas consultas, considere normalizar os documentos (antes ou durante a indexação) e as consultas (depois que o usuário fez a consulta) das seguintes maneiras:

  • Para normalizar documentos, faça o seguinte:

    1. Escolha uma grafia canônica para palavras essenciais usadas em documentos nos repositórios.
    2. Corrija a ortografia em documentos do repositório de origem ou ao indexar conteúdo para corresponder à ortografia canônica.
  • Para normalizar consultas:

    1. Intercepte as consultas dos usuários antes de enviá-las ao Cloud Search.
    2. Reescreva as palavras nas consultas do usuário para que correspondam à grafia mais comum na fonte de dados indexada.
    3. Envie a consulta ao Cloud Search.

Desativar expansões, interpretações e otimizações para todas as consultas

Para desativar expansões, interpretações e otimizações de uma consulta específica, defina QueryInterpretationOptions.enableVerbatim Mode como true na solicitação de pesquisa.