补偿默认扩展、解释和优化

Google Cloud Search 有多种默认的扩展、解释和解释, 影响搜索结果的优化措施。如果您看到意外的 搜索查询的结果,请在联系 Cloud Search 前先参阅此指南 联系。

默认展开方式

假设用户使用字符串进行搜索,如 [小张的 PDF],但 一些返回的结果包含突出显示的字词,例如“documents”,而非 “PDF”。为什么结果中包含突出显示的字词,而该字词不在 搜索查询的内容?

默认情况下,与 Google 网页搜索一样,Google Cloud Search 不仅 搜索与查询中完全匹配的字词。而 Cloud Search 会扩展查询 以包含同义词和词干(即使您没有自行实现 同义词)。进行此扩展是为了检索与 查询的构思和意图选择完这些庞大的文档后 排名算法会确保将最佳匹配结果显示在最前面 结果集。

当用户搜索 [Joe 的 PDF] 时,Cloud Search 提供了以下内容作为 其他可接受的字词:

  • 对于 [Joe’s],Cloud Search 可能还会匹配“joe”(词干扩展)和“joes”(a 基于标点符号的同义词)。
  • 对于 [PDF],Cloud Search 可能还会匹配“documents”(同义词扩展) 和“pdf”(主干扩展)。

默认情况下,同义词不一定是双向的。例如,如果用户 搜索字词“钓鱼式攻击”,Cloud Search 可能会将“钓鱼式攻击”视为同义词 扩展。不过,如果用户搜索“网上诱骗”一词,Google 可能不会 将“钓鱼式攻击”视为扩展匹配。

带连字符的字词与不带连字符的字词的扩展

当用户搜索带连字符的字词与不带连字符的字词时 类似商品,例如 Cloud Search 的 [步入式衣柜] 和 [走入衣橱] 处理这些查询的方式不同。

此外,对于连字符和下划线而言,还使用不同的优化方法。 例如 [步行] 和 [步行]。

补偿默认展开

默认情况下,我们不保证一定会进行扩展。如果您想 确保同义词或特定领域的同义词扩展的双向性, 创建您自己的一组特定领域的同义词。如需详细了解 请参阅 定义同义词

默认解释

Cloud Search 还提供自然语言解释功能, 按照说明来解释查询中使用的对象、属性和字段值, 为特定数据源上传的架构。如需更多信息 请参阅 构建架构以获得最佳查询解释

停用自然语言解释

要针对特定查询停用自然语言解释,请将 QueryInterpretationOptions.disableNlInterpretation true

默认优化

Cloud Search 还提供了以下默认优化选项:

  • 混入拼写更正提供的结果。例如,如果查询 字符串为 [corpoateBenefits],Cloud Search 将匹配“corpoate”和 “corporate”的正确拼写。

  • 对于生成的结果数量为零或很少的查询,Cloud Search 会使用 在匹配时,一组宽松的相关字词,比直接同义词更宽泛 结果。如需了解详情,请参阅 处理补充结果

将文档和查询标准化

标准化是指对某些字词或词组进行标准化处理, 还是在执行完查询后触发为确保系统能够更加一致地响应您的 查询,请考虑对文档进行标准化(编入索引之前或期间)和 查询(在用户进行查询之后),方法如下:

  • 如需将文档标准化,请执行以下操作:

    1. 为 内文档中的关键字词选择规范拼写 代码库
    2. 更正源代码库文档中或编入索引时的拼写 来匹配规范拼写
  • 要将查询标准化,请执行以下操作:

    1. 先拦截用户查询,然后再将其发送到 Cloud Search。
    2. 重写用户查询中的字词,以匹配 编入索引的数据源。
    3. 将查询发送到 Cloud Search。

为所有查询停用扩展、解释和优化

要针对特定查询停用扩展、解释和优化, 设置 QueryInterpretationOptions.enableVerbatim Mode true