补偿默认扩展、解释和优化

Google Cloud Search 具有多项默认的扩展、解释和优化,这些都会影响搜索结果。如果您看到意外的搜索结果,请先参阅本指南,然后再与 Cloud Search 支持团队联系。

在本文档中,用户查询以方括号显示(例如 [query]) 系统解释以引号显示(例如 "interpretation")。

本文档中的查询结果是行为的说明性示例,可帮助您了解扩展、解释和优化的工作原理;实际结果可能会有所不同。

默认扩展

假设用户搜索 [Joe’s PDFs],但某些结果包含 突出显示的字词(例如 "documents"),而不是 "PDFs"。发生这种情况是因为 Cloud Search 会扩展查询以包含同义词和词干,这与 Google 搜索类似。此扩展有助于检索与查询的想法和意图相匹配的文档。然后,排名算法会确保最佳匹配项显示在顶部。

当用户搜索 [Joe’s PDFs] 时,Cloud Search 可能会提供以下附加字词:

  • 对于 [Joe’s],它可能会匹配 "joe"(词干扩展)和 "joes" (基于标点符号的同义词)。
  • 对于 [PDFs],它可能会匹配 "documents"(同义词扩展)和 "pdf" (词干扩展)。

默认同义词并不总是双向的。例如,搜索 [phishing] 可能会匹配 "phish",但搜索 [phish] 可能不会 匹配 "phishing"

连字号和下划线字词的扩展

Cloud Search 会以不同的方式处理带连字号的字词及其不带连字号的 等效字词,例如 [walk-in closet][walk in closet]。 它还会对带连字号和下划线的字词应用不同的优化,例如 [walk-in][walk_in]

补偿默认扩展

Cloud Search 不保证任何特定的扩展。如需确保双向同义词或特定于网域的扩展,请创建自己的同义词。如需了解详情,请参阅定义 同义词

默认解释

Cloud Search 会根据您的数据源架构提供自然语言解释。如需了解详情,请参阅构建架构以获得 最佳查询解释

停用自然语言解释

如需针对特定查询停用自然语言解释,请在搜索请求中将 QueryInterpretationOptions.disableNlInterpretation 设置为 true

默认优化

Cloud Search 提供以下默认优化:

  • 拼写更正混合:对于查询 [corpoate benefits], Cloud Search 会匹配 "corpoate" 和正确的拼写, "corporate"

  • 补充结果:对于结果很少或没有结果的查询,Cloud Search 会使用一组宽松的相关术语。如需了解更多 信息,请参阅处理补充 结果

规范化文档和查询

规范化是指在查询之前或之后对字词或短语进行标准化。为确保响应一致,请考虑以下规范化步骤:

  • 如需规范化文档,请执行以下操作:

    1. 为代码库中的关键字词选择规范拼写。
    2. 更正源文档中的拼写或在编入索引期间更正拼写,以匹配规范形式。
  • 如需规范化查询,请执行以下操作:

    1. 在将用户查询发送到 Cloud Search 之前拦截这些查询。
    2. 重写查询中的字词,以匹配编入索引的数据源中最常见的拼写。
    3. 将重写的查询发送到 Cloud Search。

停用扩展、解释和优化

如需针对特定查询停用这些功能,请在搜索请求中将 QueryInterpretationOptions.enableVerbatimMode 设置为 true