Compensar expansões, interpretações e otimizações padrão

O Google Cloud Search tem várias expansões, interpretações e otimizações padrão que afetam os resultados da pesquisa. Se você encontrar resultados inesperados nas consultas de pesquisa, consulte este guia antes de entrar em contato com o suporte do Cloud Search.

Expansões padrão

Suponha que um usuário esteja pesquisando usando uma string, como [PDFs do Joe], mas alguns resultados retornados contenham palavras destacadas, como "documentos", em vez de "PDFs". Por que os resultados contêm as palavras em destaque que não estavam na consulta de pesquisa?

Por padrão, o Google Cloud Search, assim como a Pesquisa Google na Web, não pesquisa apenas as palavras exatas em uma consulta. Em vez disso, o Cloud Search expande a consulta para incluir sinônimos e radicais de palavras, mesmo que você não tenha implementado seus próprios sinônimos. Essa expansão é feita para recuperar documentos que correspondem de forma geral à ideia e à intenção da consulta. Depois que esse conjunto amplo de documentos é selecionado, os algoritmos de classificação trabalham para garantir que as melhores correspondências sejam colocadas no topo do conjunto de resultados.

Quando o usuário pesquisou [PDFs do Joe], o Cloud Search forneceu as seguintes palavras aceitáveis:

  • Para [Joe's], o Cloud Search também pode corresponder a "joe" (uma expansão de raiz) e "joes" (um sinônimo com base na pontuação).
  • Para [PDFs], o Cloud Search também pode corresponder a "documentos" (uma expansão de sinônimos) e "pdf" (uma expansão de raiz).

Por padrão, os sinônimos não são necessariamente bidirecionais. Por exemplo, se um usuário pesquisar o termo "phishing", a Pesquisa do Cloud pode corresponder a "phish" como uma expansão de sinônimo. No entanto, se o usuário pesquisar o termo "phish", o Google talvez não encontre "phishing" como uma expansão.

Expansões para palavras com e sem hífen

Quando o usuário pesquisa palavras com hífen em vez de equivalentes sem hífen, como [closet] e [closet], o Cloud Search trata essas consultas de maneira diferente.

Além disso, diferentes otimizações são usadas para palavras sublinhadas e com hífen, como [walk-in] e [walk_in].

Compensar expansões padrão

Não há garantia de expansão por padrão. Se você quiser garantir a bidirecionalidade de sinônimos ou expansões de sinônimos específicos do domínio, crie seu próprio conjunto de sinônimos específicos do domínio. Para mais informações sobre como implementar sinônimos, consulte Definir sinônimos.

Interpretações padrão

O Cloud Search também oferece interpretação de linguagem natural, que interpreta os objetos, as propriedades e os valores de campo usados em uma consulta de acordo com o esquema enviado para uma determinada origem de dados. Para mais informações sobre essa interpretação de linguagem natural, consulte Estruturar seu esquema para a interpretação ideal de consultas.

Desativar interpretações de linguagem natural

Para desativar as interpretações de linguagem natural em uma consulta específica, defina QueryInterpretationOptions.disableNlInterpretation como true na solicitação de pesquisa.

Otimizações padrão

O Cloud Search também oferece estas otimizações padrão:

  • Mesclagem de resultados fornecidos pela correção ortográfica. Por exemplo, se a string de consulta for [benefícios corporativos], a Pesquisa do Cloud vai corresponder a "benefícios corporativos" e a ortografia correta de "corporativo".

  • Para consultas que não geram resultados ou geram poucos resultados, o Cloud Search usa um conjunto mais permissivo de termos relacionados, mais amplo do que sinônimos diretos, ao fazer a correspondência de resultados. Para mais informações, consulte Processar resultados suplementares.

Como normalizar documentos e consultas

A normalização se refere à padronização de determinadas palavras ou frases antes ou depois de uma consulta. Para garantir respostas mais consistentes às suas consultas, considere normalizar seus documentos (antes ou durante a indexação) e consultas (depois que o usuário fez a consulta) das seguintes maneiras:

  • Para normalizar documentos:

    1. Escolha uma grafia canônica para palavras importantes usadas em documentos nos seus repositórios.
    2. Corrija a ortografia nos documentos do repositório de origem ou ao indexar conteúdo para corresponder à ortografia canônica.
  • Para normalizar consultas:

    1. Intercepção de consultas do usuário antes do envio para o Cloud Search.
    2. Reescrever palavras em consultas do usuário para corresponder à grafia mais comum na fonte de dados indexada.
    3. Envie a consulta ao Cloud Search.

Desativar expansões, interpretações e otimizações para todas as consultas

Para desativar expansões, interpretações e otimizações para uma consulta específica, defina QueryInterpretationOptions.enableVerbatim Mode como true na solicitação de pesquisa.