重写查询

本页介绍了如何更改或响应用户的查询,以提供更相关或更符合您网站要求的搜索结果。

  1. 概览
  2. 使用优化标签附加搜索查询
  3. 使用同义词扩展搜索查询
  4. 自动填充查询

概览

如果您非常了解自己的受众群体,则可以大致预测出他们可能会搜索的内容类型。您可以预测用户的查询内容,并帮助他们找到更相关的结果。

借助可编程搜索引擎,您可以在用户的查询中附加搜索字词,并为用户的查询创建同义词。第一项功能是通过优化实现的,用户可以应用或忽略此类优化;同义词功能则不要求用户进行任何操作,即可基于用户的查询进行操作。

使用优化标签附加搜索查询

如需提供向用户查询添加有用搜索字词的优化链接,请使用可编程搜索 XML 注释文件中的 Rewrite 元素。当用户点击优化链接时,该元素就会将搜索字词附加到用户的查询中。Rewrite 元素最多可以包含 100 个字符,所有字符都应采用小写形式,但大写搜索运算符(例如 OR)除外。如需详细了解搜索运算符,请参阅轻松进行高级搜索。如需详细了解优化,请参阅优化搜索

以下示例展示了如何使用 Rewrite

<CustomSearchEngine>
  <Title>Universities</Title>
  <Context>
    <Facet>
      <FacetItem title="Homework">
        <Label name="assignments" mode="BOOST">
          <Rewrite>homework OR assignment</Rewrite>
        </Label>
      </FacetItem>
    </Facet>
  </Context>
</CustomSearchEngine>

该示例展示了如何帮助点击名为“家庭作业”的优化链接的用户。它会将额外的搜索字词“homework”和“assignment”附加到用户输入的搜索查询。

包含 Rewrite 元素的优化具有以下结构:

  • Facet
    • FacetItem
      • Label name
        • Rewrite

返回页首

使用同义词扩展搜索查询

您可以使用搜索字词的变体(即同义词)扩展用户的搜索查询。例如,与金融相关的搜索查询“利息”可能有以下等效的替代字词:“收益”“股息”“优惠券”等。如果您为金融搜索引擎中的“兴趣”创建同义词,您的用户将无需输入多个变体即可查找所需信息。可编程搜索引擎会自动搜索所有与“利息”“收益”“股息”“优惠券”和其他相关字词相关的网站。

无论用户是自行输入搜索字词还是与一系列其他字词一起输入,包含您定义的同义词的搜索字词都会自动触发搜索扩展。假设您将“ninja”定义为带有同义词变体“assassin”的搜索字词。任何包含“忍者”一词的搜索查询(例如只包括“忍者”或“忍者热狗大吃竞赛”)都会扩展该查询,以包含同义词变体。就像用户搜索了“ninja OR assassin”或“ninja OR assassin hotdog eating game”。

最佳实践

不妨使用与您的专业领域或兴趣相符的热门查询字词、常见的首字母缩略词(例如“CD”代表“存款证明”)以及熟悉的缩写(例如“munis”代表“市政债券”)。如果您的搜索引擎非常热门,并获得了很多针对相同查询的搜索,那么,您可以从统计信息页获取有关最热门查询的数据。访问控制面板,针对相应搜索引擎,点击统计信息链接。页面底部列出了热门查询。

您无需为热门查询字词创建同义词。例如,对于大部分网络用户来说,“英国”“英国”“英国”和“英国”都是众所周知的变体(如果技术上不是同义词)。Google 已拥有大量此类字词的同义词,因此您无需重复此工作。 而应根据搜索引擎用户的兴趣,针对常用字词创建同义词。例如,在金融搜索引擎中,“债券”就是一个不错的选择。Google 可能不知道用户搜索的是“詹姆斯·邦德”“化学键”“粘合键”还是“情感键”。另一方面,您知道他们在寻找一种金融工具,可以轻松想出“固定收入保障”和“问题”等同义词。

如果您无法区分某个字词是常见还是特殊,可以在 Google 搜索中测试该字词及其变体。在 Google 搜索中输入查询字词(如“北京”),然后打开新的浏览器窗口。在 Google 搜索框中,输入查询字词、搜索运算符 OR 以及查询字词的变体(例如“san francisco OR sf”)。比较两个结果页。如果它们完全相同,则 Google 涵盖了同义词。

创建同义词

与任何 XML 文件一样,您可以使用简单的文本编辑器来创建和编辑同义词文件。只需使用文件扩展名 .xml 保存文本文件(例如 syn_finance.xml)即可。

下面是一个同义词文件的示例:

<Synonyms>
  <Synonym term="stock">
    <Variant>equity</Variant>
    <Variant>share</Variant>
  </Synonym>
  <Synonym term="bond">
    <Variant>fixed-income security</Variant>
    <Variant>issue</Variant>
    <Variant>high yield debt</Variant>
  </Synonym>
</Synonyms>

同义词文件包含一个 元素和一个可以有多个同级的子元素,如以下层次结构所述:

  • Synonyms (仅限 1 个)
    • Synonym term (允许多个同级)
      • Variant(每个Synonym最多 10 个)

您可以在 Synonym 子元素的属性值中创建搜索字词,并在 Variant 元素中定义其每个同义词。搜索字词及其同义词变体可以是单个字词(如“cookie”)或短语(如“ Buttermilk cookie”或“crying over spilled milk”)。

限制

下表列出了同义词文件的限制:

商品 允许的数量上限
搜索字词数量(Synonym term 个元素) 添加多个搜索字词,前提是每个搜索引擎的变体总数不超过 500 个。
每个搜索字词的变体(Variant 个元素)数量 10

 

相应搜索引擎的变体(Variant 个元素)的总数 2000
文件大小 500KB
文件数 您可以根据需要添加任意数量的文件,只要帐号中所有文件的总大小不超过 4MB 即可

返回页首

自动填充查询

自动补全功能是一个建议查询列表,当用户在搜索框中输入查询时,系统就会显示这些建议查询。

图 1 :在搜索框中输入几个字符,系统会显示一个下拉列表,其中会提供针对不同搜索查询的选项。

在可编程搜索引擎中为旅行网站输入 p-u-e-r 后,系统会显示一个下拉列表,其中包含波多黎各、巴亚尔塔港酒店、波多黎各度假等选项。

用于自动填充的可选查询列表部分取决于网站内容和查询字词的热门程度。不过,您可以自定义自动补全功能,只需在控制台中添加项或从中删除字词,即可实现此功能,既可以使用控制台,也可以通过 XML 文件批量上传。

启用自动补全功能

要使用可编程搜索元素在搜索引擎中启用自动补全,请执行以下操作:

  1. 在搜索引擎的“搜索功能”页上,滚动到自动补全部分。
  2. 选中启用自动补全复选框。

您可以在搜索引擎的“搜索功能”页面的自动填充部分添加或移除个别字词,也可以使用 XML 上传所有字词。您添加的字词会显示在针对所有查询通过算法生成的字词的上方。

自动补全字词最多需要 48 小时才能开始在您的搜索引擎中显示。

要批量添加或移除字词,请上传自动补全 XML 文件。与任何 XML 文件一样,您可以使用简单的文本编辑器创建和修改自动补全文件。只需使用文件扩展名 .xml 保存文本文件(例如 autocompletion_finance.xml)。

添加和移除自动补全字词

以下是一个可以上传的自动补全文件示例。

<Autocompletions>
  <Autocompletion term="cake" type="1"/>
  <Autocompletion term="strawberry.*" type="2" match="2"/>
  <Autocompletion term="vanilla" type="2"/>
</Autocompletions>

在示例代码中,“apple”包含在可能的自动补全字词列表中,而“vanilla”以及任何以“strawberry”开头的字词则绝不会作为自动补全字词呈现给用户。

自动填充文件包含一个元素和一个可以有多个同级的子元素,如以下层次结构所述:

  • Autocompletions(仅限 1)
    • Autocompletion(允许多个同级)

下表列出了自动补全属性名称。

属性名称 说明
term 要包含或排除的单个字词或正则表达式。 要包含或排除的自动补全字词。例如,如果您要将“storm shadow”添加到向用户显示的自动补全字词列表中,请添加“storm shadow”值。请注意,在多个 Autocompletion 条目中使用相同的字词会导致错误。一个字词最多可以包含 100 个字符。系统会忽略超过 100 个字符的字词。
type 指定在自动补全查询中包含还是排除相应字词。 指定以下任一内容:
  • 1 - 包含字词
  • 2 - 排除字词
  • match 可选。指定您是希望搜索字词完全匹配还是与正则表达式匹配。 指定以下任一内容:
  • 1 - 默认。完全匹配。
  • 2 - 表示正则表达式。只有排除的字词可以使用正则表达式。
  • 返回页首