O Google Cloud Search tem várias expansões, interpretações e otimizações padrão que afetam os resultados da pesquisa. Se você encontrar resultados inesperados em consultas de pesquisa, consulte este guia antes de entrar em contato com o suporte do Cloud Search.
Expansões padrão
Suponha que um usuário esteja pesquisando usando uma string, como [PDFs do João], mas alguns resultados retornados contenham palavras destacadas, como "documentos", em vez de "PDFs". Por que os resultados contêm palavras destacadas que não estavam na consulta de pesquisa?
Por padrão, o Google Cloud Search, assim como a Pesquisa Google na Web, não procura apenas as palavras exatas em uma consulta. Em vez disso, o Cloud Search expande a consulta para incluir sinônimos e radicais de palavras, mesmo que você não tenha implementado seus próprios sinônimos. Essa expansão é feita para recuperar documentos que correspondem à ideia e à intenção da consulta. Depois que esse conjunto amplo de documentos é selecionado, os algoritmos de classificação trabalham para garantir que as melhores correspondências sejam colocadas na parte superior do conjunto de resultados.
Quando o usuário pesquisou [PDFs do João], o Cloud Search forneceu as seguintes palavras aceitáveis adicionais:
- Para [Joe’s], o Cloud Search também pode corresponder a "joe" (uma expansão de radical) e "joes" (um sinônimo com base na pontuação).
- Para [PDFs], o Cloud Search também pode corresponder a "documentos" (uma expansão de sinônimos) e "pdf" (uma expansão de radicais).
Por padrão, os sinônimos não são necessariamente bidirecionais. Por exemplo, se um usuário pesquisar o termo "phishing", o Cloud Search poderá corresponder a "phish" como uma expansão de sinônimo. No entanto, se o usuário pesquisar o termo "phish", o Google talvez não faça a correspondência com "phishing" como uma expansão.
Expansões para palavras com e sem hífen
Quando o usuário pesquisa palavras hifenizadas e não hifenizadas, como [walk-in closet] e [walk in closet], o Cloud Search trata essas consultas de maneira diferente.
Além disso, otimizações diferentes são usadas para palavras com hífen e sublinhadas, como [walk-in] e [walk_in].
Compensar as expansões padrão
Não há garantia de expansão por padrão. Se você quiser garantir a bidirecionalidade dos sinônimos ou expansões de sinônimos específicos do domínio, crie seu próprio conjunto de sinônimos específicos do domínio. Para mais informações sobre como implementar sinônimos, consulte Definir sinônimos.
Interpretações padrão
O Cloud Search também oferece interpretação de linguagem natural, que interpreta os objetos, as propriedades e os valores de campo usados em uma consulta de acordo com o esquema enviado para uma origem de dados específica. Para mais informações sobre essa interpretação de linguagem natural, consulte Estruturar um esquema para a interpretação ideal de consultas.
Desativar interpretações de linguagem natural
Para desativar as interpretações em linguagem natural de uma consulta específica, defina
QueryInterpretationOptions.disableNlInterpretation
como true
na solicitação de pesquisa.
Otimizações padrão
O Cloud Search também oferece estas otimizações padrão:
Mistura nos resultados fornecidos pela correção ortográfica. Por exemplo, se a string de consulta for [corpoate benefits], o Cloud Search vai corresponder a "corpoate" e a ortografia correta de "corporate".
Para consultas que geram poucos ou nenhum resultado, o Cloud Search usa um conjunto mais permissivo de termos relacionados, mais amplo do que sinônimos diretos, ao corresponder resultados. Para mais informações, consulte Processar resultados complementares.
Normalizar documentos e consultas
A normalização se refere à padronização de determinadas palavras ou frases antes ou depois de uma consulta. Para garantir respostas mais consistentes às suas consultas, normalize seus documentos (antes ou durante a indexação) e consultas (depois que o usuário faz a consulta) das seguintes maneiras:
Para normalizar documentos:
- Escolha uma grafia canônica para palavras importantes usadas em documentos nos seus repositórios.
- Corrija a ortografia nos documentos do repositório de origem ou ao indexar conteúdo para corresponder à ortografia canônica.
Para normalizar consultas:
- Interceptar consultas do usuário antes de enviá-las ao Cloud Search.
- Reescrever palavras em consultas do usuário para corresponder à grafia mais comum na fonte de dados indexada.
- Envie a consulta para o Cloud Search.
Desativar expansões, interpretações e otimizações para todas as consultas
Para desativar expansões, interpretações e otimizações em uma consulta específica,
defina
QueryInterpretationOptions.enableVerbatim Mode
como true
na solicitação de pesquisa.