Google Cloud Search 有多种默认的扩展、解释和解释, 影响搜索结果的优化措施。如果您看到意外的 搜索查询的结果,请在联系 Cloud Search 前先参阅此指南 联系。
默认展开方式
假设用户使用字符串进行搜索,如 [小张的 PDF],但 一些返回的结果包含突出显示的字词,例如“documents”,而非 “PDF”。为什么结果中包含突出显示的字词,而该字词不在 搜索查询的内容?
默认情况下,与 Google 网页搜索一样,Google Cloud Search 不仅 搜索与查询中完全匹配的字词。而 Cloud Search 会扩展查询 以包含同义词和词干(即使您没有自行实现 同义词)。进行此扩展是为了检索与 查询的构思和意图选择完这些庞大的文档后 排名算法会确保将最佳匹配结果显示在最前面 结果集。
当用户搜索 [Joe 的 PDF] 时,Cloud Search 提供了以下内容作为 其他可接受的字词:
- 对于 [Joe’s],Cloud Search 可能还会匹配“joe”(词干扩展)和“joes”(a 基于标点符号的同义词)。
- 对于 [PDF],Cloud Search 可能还会匹配“documents”(同义词扩展) 和“pdf”(主干扩展)。
默认情况下,同义词不一定是双向的。例如,如果用户 搜索字词“钓鱼式攻击”,Cloud Search 可能会将“钓鱼式攻击”视为同义词 扩展。不过,如果用户搜索“网上诱骗”一词,Google 可能不会 将“钓鱼式攻击”视为扩展匹配。
带连字符的字词与不带连字符的字词的扩展
当用户搜索带连字符的字词与不带连字符的字词时 类似商品,例如 Cloud Search 的 [步入式衣柜] 和 [走入衣橱] 处理这些查询的方式不同。
此外,对于连字符和下划线而言,还使用不同的优化方法。 例如 [步行] 和 [步行]。
补偿默认展开
默认情况下,我们不保证一定会进行扩展。如果您想 确保同义词或特定领域的同义词扩展的双向性, 创建您自己的一组特定领域的同义词。如需详细了解 请参阅 定义同义词。
默认解释
Cloud Search 还提供自然语言解释功能, 按照说明来解释查询中使用的对象、属性和字段值, 为特定数据源上传的架构。如需更多信息 请参阅 构建架构以获得最佳查询解释。
停用自然语言解释
要针对特定查询停用自然语言解释,请将
QueryInterpretationOptions.disableNlInterpretation
true
。
默认优化
Cloud Search 还提供了以下默认优化选项:
混入拼写更正提供的结果。例如,如果查询 字符串为 [corpoateBenefits],Cloud Search 将匹配“corpoate”和 “corporate”的正确拼写。
对于生成的结果数量为零或很少的查询,Cloud Search 会使用 在匹配时,一组宽松的相关字词,比直接同义词更宽泛 结果。如需了解详情,请参阅 处理补充结果。
将文档和查询标准化
标准化是指对某些字词或词组进行标准化处理, 还是在执行完查询后触发为确保系统能够更加一致地响应您的 查询,请考虑对文档进行标准化(编入索引之前或期间)和 查询(在用户进行查询之后),方法如下:
如需将文档标准化,请执行以下操作:
- 为 内文档中的关键字词选择规范拼写 代码库
- 更正源代码库文档中或编入索引时的拼写 来匹配规范拼写
要将查询标准化,请执行以下操作:
- 先拦截用户查询,然后再将其发送到 Cloud Search。
- 重写用户查询中的字词,以匹配 编入索引的数据源。
- 将查询发送到 Cloud Search。
为所有查询停用扩展、解释和优化
要针对特定查询停用扩展、解释和优化,
设置
QueryInterpretationOptions.enableVerbatim Mode
true
。