O Google Cloud Search tem várias expansões, interpretações e otimizações padrão que afetam os resultados da pesquisa. Caso você veja resultados inesperados em consultas de pesquisa, consulte este guia antes de entrar em contato com o suporte do Cloud Search.
Expansões padrão
Suponha que um usuário esteja pesquisando usando uma string, como [PDFs do João], mas alguns resultados retornados contêm palavras destacadas, como "documentos", em vez de "PDFs". Por que os resultados contêm as palavras destacadas que não estavam na consulta de pesquisa?
Por padrão, o Google Cloud Search, assim como o Google Web Search, não pesquisa apenas as palavras exatas de uma consulta. Em vez disso, o Cloud Search expande a consulta para incluir sinônimos e variações de palavras, mesmo que você não tenha implementado os próprios sinônimos. Essa expansão é feita para recuperar documentos que correspondam amplamente à ideia e à intenção da consulta. Depois que esse amplo conjunto de documentos é selecionado, os algoritmos de classificação trabalham para garantir que as melhores correspondências sejam colocadas na parte superior do conjunto de resultados.
Quando o usuário pesquisou [PDFs do João], o Cloud Search forneceu as seguintes palavras como outras palavras aceitáveis:
- Para [João], o Cloud Search também pode corresponder a "joe" (uma expansão de stem) e "joes" (um sinônimo baseado em pontuação).
- Para [PDFs], o Cloud Search também pode corresponder a "documentos" (uma expansão de sinônimo) e "pdf" (uma expansão de radical).
Por padrão, os sinônimos não são necessariamente bidirecionais. Por exemplo, se um usuário pesquisar o termo "phishing", o Cloud Search poderá corresponder "phish" como uma expansão de sinônimo. No entanto, se o usuário pesquisar o termo "phish", o Google talvez não corresponda a "phishing" como uma expansão.
Expansões para palavras com e sem hífen
Quando o usuário pesquisa palavras com hífen em vez de equivalentes sem hífen, como [walk-in closet] e [walk in closet], o Cloud Search trata essas consultas de maneira diferente.
Além disso, otimizações diferentes são usadas para palavras com hífen e sublinhado, como [passeio] e [passeio_in].
Compensar por expansões padrão
Por padrão, não há garantia de expansão. Se você quiser garantir a bidirecionalidade de sinônimos ou expansões de sinônimos específicos do domínio, crie seu próprio conjunto de sinônimos específicos do domínio. Para mais informações sobre a implementação de sinônimos, consulte Definir sinônimos.
Interpretações padrão
O Cloud Search também oferece interpretação de linguagem natural que interpreta os objetos, as propriedades e os valores de campo usados em uma consulta de acordo com o esquema enviado para uma determinada fonte de dados. Para mais informações sobre essa interpretação de linguagem natural, consulte Estruturar seu esquema para a interpretação ideal de consultas.
Desativar interpretações de linguagem natural
Para desativar interpretações de linguagem natural para uma consulta específica, defina QueryInterpretationOptions.disableNlInterpretation
como true
na solicitação de pesquisa.
Otimizações padrão
O Cloud Search também oferece estas otimizações padrão:
Combinação dos resultados fornecidos pela correção ortográfica. Por exemplo, se a string da consulta fosse [corporar benefícios], o Cloud Search corresponderia à grafia correta de "corporativo" e "corporativo".
Para consultas que teriam zero ou poucos resultados, o Cloud Search usa um conjunto mais permissivo de termos relacionados, mais amplo do que sinônimos diretos, para fazer a correspondência dos resultados. Para mais informações, consulte Processar resultados complementares.
Normalização de documentos e consultas
Normalização refere-se à padronização de certas palavras ou frases antes ou depois de uma consulta ser feita. Para garantir respostas mais consistentes às suas consultas, considere normalizar os documentos (antes ou durante a indexação) e as consultas (depois que o usuário fez a consulta) das seguintes maneiras:
Para normalizar documentos, faça o seguinte:
- Escolha uma grafia canônica para palavras essenciais usadas em documentos nos repositórios.
- Corrija a ortografia em documentos do repositório de origem ou ao indexar conteúdo para corresponder à ortografia canônica.
Para normalizar consultas:
- Intercepte as consultas dos usuários antes de enviá-las ao Cloud Search.
- Reescreva as palavras nas consultas do usuário para que correspondam à grafia mais comum na fonte de dados indexada.
- Envie a consulta ao Cloud Search.
Desativar expansões, interpretações e otimizações para todas as consultas
Para desativar expansões, interpretações e otimizações de uma consulta específica, defina QueryInterpretationOptions.enableVerbatim Mode
como true
na solicitação de pesquisa.