Google Cloud Search 具有多项默认的扩展、解释和优化,这些都会影响搜索结果。如果您看到意外的搜索结果,请先参阅本指南,然后再与 Cloud Search 支持团队联系。
在本文档中,用户查询以方括号显示(例如 [query])
系统解释以引号显示(例如 "interpretation")。
本文档中的查询结果是行为的说明性示例,可帮助您了解扩展、解释和优化的工作原理;实际结果可能会有所不同。
默认扩展
假设用户搜索 [Joe’s PDFs],但某些结果包含
突出显示的字词(例如 "documents"),而不是 "PDFs"。发生这种情况是因为
Cloud Search 会扩展查询以包含同义词和词干,这与 Google 搜索类似。此扩展有助于检索与查询的想法和意图相匹配的文档。然后,排名算法会确保最佳匹配项显示在顶部。
当用户搜索 [Joe’s PDFs] 时,Cloud Search 可能会提供以下附加字词:
- 对于
[Joe’s],它可能会匹配"joe"(词干扩展)和"joes"(基于标点符号的同义词)。 - 对于
[PDFs],它可能会匹配"documents"(同义词扩展)和"pdf"(词干扩展)。
默认同义词并不总是双向的。例如,搜索
[phishing] 可能会匹配 "phish",但搜索 [phish] 可能不会
匹配 "phishing"。
连字号和下划线字词的扩展
Cloud Search 会以不同的方式处理带连字号的字词及其不带连字号的
等效字词,例如 [walk-in closet] 和 [walk in closet]。
它还会对带连字号和下划线的字词应用不同的优化,例如 [walk-in] 和 [walk_in]。
补偿默认扩展
Cloud Search 不保证任何特定的扩展。如需确保双向同义词或特定于网域的扩展,请创建自己的同义词。如需了解详情,请参阅定义 同义词。
默认解释
Cloud Search 会根据您的数据源架构提供自然语言解释。如需了解详情,请参阅构建架构以获得 最佳查询解释。
停用自然语言解释
如需针对特定查询停用自然语言解释,请在搜索请求中将
QueryInterpretationOptions.disableNlInterpretation
设置为 true。
默认优化
Cloud Search 提供以下默认优化:
拼写更正混合:对于查询
[corpoate benefits], Cloud Search 会匹配"corpoate"和正确的拼写,"corporate"。补充结果:对于结果很少或没有结果的查询,Cloud Search 会使用一组宽松的相关术语。如需了解更多 信息,请参阅处理补充 结果。
规范化文档和查询
规范化是指在查询之前或之后对字词或短语进行标准化。为确保响应一致,请考虑以下规范化步骤:
如需规范化文档,请执行以下操作:
- 为代码库中的关键字词选择规范拼写。
- 更正源文档中的拼写或在编入索引期间更正拼写,以匹配规范形式。
如需规范化查询,请执行以下操作:
- 在将用户查询发送到 Cloud Search 之前拦截这些查询。
- 重写查询中的字词,以匹配编入索引的数据源中最常见的拼写。
- 将重写的查询发送到 Cloud Search。
停用扩展、解释和优化
如需针对特定查询停用这些功能,请在搜索请求中将
QueryInterpretationOptions.enableVerbatimMode
设置为 true。