主题引擎

主题搜索引擎是专注于特定主题的引擎。 它涵盖整个网络的部分内容,而不是某个特定网站。之所以能够覆盖,是因为可编程搜索引擎允许您在一个引擎中添加多个网站。本文介绍了构建和维护此类引擎的一些有趣技术。

为什么要构建主题搜索引擎?

您可以使用标准 google.com 搜索引擎执行非常精确且可靠的高级搜索,方法是选择合适的关键字,使用搜索运算符和过滤结果。但是,某些用户可能不熟悉这些高级技术。 由于您了解用户所处的环境以及搜索的主题,因此您可以引导用户完成搜索过程,并更轻松地发现所选网域中的重要资源。

下面提供了一些可用于构建优质主题引擎的技巧:

  • 要搜索的网站编入索引的精选网站
  • 重写查询
  • 在搜索结果中显示更多数据

精选索引

有时,搜索字词可能含糊不清或含义不同,具体取决于上下文。通过在引擎中仅加入高质量的相关网站,您可以缩小搜索范围,使结果更精确且更有意义。

使用网址格式

如果需要,请务必使用网址格式,以便仅搜索网站的某一部分。 例如,如果您只想在 html5rocks.com 网站上搜索有关浏览器速度的教程,则可以在要搜索的网站中使用 html5rocks.com/en/tutorials/speed/* 网址格式。

如果您不熟悉自己考虑添加到引擎中的网站的网址结构,可以在 google.com 中执行 site: 搜索来查看。例如,要查看 html5rocks.com 中的网址示例,请在 google.com 搜索框中输入 site:www.html5rocks.com

重写查询

如果您非常了解自己的受众群体,那么您可以预测他们的搜索查询,并代表用户应用强大的搜索功能。您可以重写其原始查询以添加其他搜索字词,并使用高级搜索运算符或应用同义词。

添加搜索字词和运算符

其他搜索字词的最典型用法是添加描述搜索网域的关键字,例如,“solar”表示太阳能搜索引擎。根据引擎的特点,您可能需要向每个查询添加其他搜索字词,或仅为部分查询添加额外的搜索字词。

您可以通过控制台在搜索功能 > 高级 > 网页搜索设置 > 查询添加字段中定义要附加到每个查询的其他搜索字词。

您还可以在每个优化标签页中添加不同的搜索字词。在搜索功能 > 优化标签页中,添加新的优化条件,并将其他搜索字词添加到可选字词字段中。当用户在引擎中搜索某个关键字并选择新建的标签时,系统会重写他们的查询,以包含该优化中的其他字词。

有时,根据用户所处的情境动态添加不同的字词会很有用。

如果您使用的是 Programmable Search ElementorTerms 参数(如果您使用的是 JSON API),则可以使用 webSearchQueryAddition 属性指定此类动态 extra 字词。

示例在本地活动搜索引擎中,如果您的应用可以访问用户的位置信息,不妨将用户所在城市的名称添加到搜索查询中。

创建同义词

您可以使用搜索字词的变体(即同义词)扩展用户的搜索查询。如果您针对可能会在您的引擎中使用的某个字词创建了同义词,那么您的用户将无需输入多个变体 - 系统会自动将替代搜索字词添加到用户的查询中。

您可以在控制台中的搜索功能 > 同义词下创建同义词。您还可以详细了解创建同义词的最佳做法

搜索结果的自定义呈现

可编程搜索引擎的可定制程度非常高,您可以使用控制台中的选项更改搜索结果的外观和风格。除此之外,如果您希望为搜索结果编写自定义标记,自定义过程可能会更加复杂。

例如,根据用户的需求,除了标准标题和文本摘要之外,您可能想要在搜索结果中显示其他数据。

使用结构化数据和自定义摘要呈现功能提供其他数据

可编程搜索引擎能够提供与文本片段中未包含的结果相关的更多信息。如果结果指向的网站或网址发布了语义标记(例如使用 schema.org 词汇表),那么相应数据可作为 pagemap 属性在搜索结果中提供。

如需检查给定网址的哪些属性是已知的,请将该网址粘贴到富媒体搜索结果测试工具中。

可以使用此方法查看提取的属性。

如果您使用的是 Custom Search JSON API,则可以在 JSON 响应对象items.pagemap 值下访问这些值。

如果您使用的是可编程搜索元素,则可以使用回调来呈现结构化数据信息。

将结果与第三方数据叠加

一种有趣的技术是,通过 Custom Search JSON API 以编程方式检索结果,然后将其与第三方数据源联接,以为最终用户提供附加价值。

摘要

主题引擎是一种非常有价值的在特定领域传播知识的方式,可为对同一主题感兴趣的用户提供巨大的价值。通过创建和整理精心挑选的网站索引、帮助用户针对给定用例构建合适的查询以及对结果进行自定义,主题引擎可以在适当的时间高效地找到适当的信息。