本页介绍了如何调整搜索引擎返回的搜索结果的排名。
概览
假设您已编制了一份希望搜索引擎涵盖的网站的列表,但当您测试某些查询时,所得结果并不完全符合您的预期。您认为与查询最相关的结果并未显示在页面顶部。或者,您可能希望更优先选择您喜爱的研究机构或您自己网站上的网页。您可以通过对结果进行升位或降位来纠正这个问题。可编程搜索引擎允许您通过三种方式调整结果:关键字、加权标签和得分。关键字和权重在上下文文件中定义,而评分在 annotations 文件中定义。
- 关键字可以快速提升搜索结果中的特定网页排名,并获得更多有关特定主题的搜索结果。
- 加权标签会告知可编程搜索引擎是排除、提升还是降位某个网站。网站的升降程度取决于您应用于标签的权重。
- 评分:应用于各个注释,调节或逆转加权标签的影响。它们为排名的微调添加了另一层粒度。
注释中的标签和分数是更改搜索结果排名的主要选项。两者的值都在 -1.0
到 +1.0
之间。您可以通过使用分数和权重转动刻度盘(增大或减小值)来将网站提升和降位。
您对排名具有很大的影响力,但您无法完全控制结果。结果的升降与许多参数有关,包括网页的相关性、关键字选择、标签的权重、注释中的得分等等。
利用关键字提升广告效果
使用关键字是改变结果的最快方式。可编程搜索引擎可以提升包含您的关键字的网页。它也可以检索有关该主题的更多搜索结果。因此,如果搜索结果中看起来无关紧要,请尝试添加关键字。 虽然可编程搜索引擎会对包含这些关键字的网页进行排名,但不会对不包含这些关键字的网页进行降位或滤除。
关键字是您将用户意图应用于搜索引擎的一种方式。例如,当瑜伽搜索引擎的用户搜索“垫子”时,他们实际搜索的是“瑜伽垫”,而不是“米勒模拟测试”或“房垫”。考虑您的搜索引擎的主要关注点以及用户搜索查询的上下文。在我们的搜索引擎示例中,“瑜伽”就是一个显而易见的关键字请勿使用过于宽泛或横跨过多类别的关键字。例如,“exercise”和“easternPractice”会检索许多与瑜伽无关的网页。最好的关键字描述您的搜索引擎所涵盖的网站的内容。
先从单个字词开始,看看能否得到想要的结果。如果您没获得足够的效果,不妨尝试使用多个关键字。您还可以使用短语,即用引号括起来的一系列字词(例如,“瑜伽姿势”),但单字词关键字的效果会更好。可编程搜索引擎将 yoga pose stretch
解读为三个关键字:“瑜伽”、“拉伸”和“姿势”。
关键字并非相互独立,而是共同发挥作用。因此,如果您指定了关键字“瑜伽”和“姿势”,则包含“瑜伽”的网页和包含“姿势”的网页会获得提升,而同时包含“瑜伽”和“姿势”的网页会获得更高的排名。
示例:关键字
让我们在瑜伽可编程搜索引擎的两个版本中比较“垫子”的搜索结果。
图 1 :不使用关键字的搜索引擎搜索查询“mat”的结果。(如需查看整个结果集,请点击该图片。)
图 2:某个搜索引擎中带有关键字“瑜伽”的搜索查询“垫子”的结果。
在包含“瑜伽”关键字的版本中,系统会在搜索结果页中宣传包含该关键字的网页。
创建关键字
您可以根据需要创建任意数量的关键字,只要不超过 100 个字符即可。创建关键字的最简单方法是通过控制台中概览页面的基本信息部分创建。您可以使用该标签页进行实验,尝试不同的关键字,并查看它们对结果页的影响。如果您对结果不满意,可以轻松地移除关键字,然后尝试其他关键字。
如果要在上下文文件中创建关键字,可以使用 CustomSearchEngine
元素的 keywords
属性定义关键字值。使用单个空格将关键字相互分隔。将短语用引号引起来;您可以使用标点符号 ("
) 或字符实体 ("
)。
<CustomSearchEngine keywords="asana "yoga postures""> </CustomSearchEngine>
使用标签更改搜索结果
更改搜索结果的另一种方法是使用标签,它们是搜索结果排名的工作负载,决定着应如何处理网站。
您可以使用两种标签:搜索引擎标签和优化标签。
搜索引擎标签决定了搜索引擎应涵盖哪些网站。它们对用户不可见,并且在后台运行;因此,其父元素称为 BackgroundLabels
。另一方面,优化标签对用户可见,并以链接的形式显示。优化搜索页面详细介绍了优化。尽管modes、权重和
得分在搜索引擎标签和优化标签中的运作方式相同,但本页的大部分内容都侧重于搜索引擎标签。
以下代码展示了上下文文件中的两种标签:
<!--Search engine labels--> <BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> <lt;/BackgroundLabels> <!--Refinement label--> <Facet> <FacetItem title="Lectures"> <Label name="lectures" mode="BOOST" weight="0.8"> <Rewrite>lecture OR lectures</Rewrite> </Label> </FacetItem> </Facet>
当您首次使用控制台 创建可编程搜索引擎时,可编程搜索引擎会为您创建两个搜索引擎标签。这些标签具有模式,用于确定应如何处理网站。其中一个是排除式 (mode="ELIMINATE"
),另一个是包含式 (mode="FILTER"
)。(在创建可编程搜索引擎后,您可以将包含式标签的模式从“FILTER”更改为“BOOST”)。
使用标签
要使用搜索引擎标签,请执行以下操作:
示例:带标签的上下文文件
以下是带有搜索引擎标签的上下文文件的截断示例。
<CustomSearchEngine keywords="climate "global warming" "greenhouse gases""> <Title>RealClimate</Title> <Description>"Climate change"</Description> <Context> <BackgroundLabels> <Label name="_include_" mode="FILTER"/> <Label name="_exclude_" mode="ELIMINATE"/> </BackgroundLabels> </Context> </CustomSearchEngine>
定义标签的模式
某个网站是被提升、降位还是排除,取决于与该网站关联的搜索引擎标签。搜索引擎标签可以具有以下模式:
注意:请注意大小写。对于模式,请使用大写字母。
模式 | 是否执行以下操作... | 在以下情况下可使用此模式: |
---|---|---|
ELIMINATE |
从您的搜索引擎中排除带有此标签的网站。 | 您想排除在 Google 搜索上排名较高但对受众群体不太满意的网页。 例如,如果您要创建一个搜索引擎来研究仓鼠的科学研究,可以使用具有 |
FILTER |
仅包含带有此标签的网站,排除所有其他内容。 | 如果您希望搜索引擎只搜索您的网站、联属营销网站或专注于特定主题的网站。 由于此类搜索引擎的覆盖范围仅限于少数网站,因此您可以更精确地控制搜索结果的排名。下一部分介绍了如何使用权重更改搜索结果的顺序。 例如,如果您希望仅为自己的网站创建一个搜索引擎,则单个网站需使用 |
BOOST |
包含您搜索引擎中的所有网站,但会将具有此标签的网站升级或降位。网站的提升或降位程度取决于您为该网站分配的权重。 | 您需要一个强调某些网站但不完全排除其他网站的宽泛搜索引擎。
例如,如果您想创建一个覆盖范围广泛的搜索引擎,但您却又专注于自己的网站(有史以来最好的网站!),可以在 |
创建加权标签
获得包含、宣传或排除网站的标签后,您可以为包含性标签指定权重。利用权重,您可以定义标签应在多大程度上将已添加代码的网站提升或降位。权重的值介于 -1.0
到 +1.0
之间。权重范围可让您对网站进行相当精细的控制。标签中的正权重表示用此标记标记的网站,负权重则表示弱化。
以下代码显示了一个加权标签:
<BackgroundLabels> <Label name="_include_" mode="FILTER" weight="0.65"/> <Label name="_exclude_" mode="ELIMINATE"/> </BackgroundLabels>
未定义权重的提升和过滤标签(例如由可编程搜索引擎生成的标签)的默认权重为 +0.7
。因此,如果您要增强生成的标签宣传网站的能力,请将该值更改为大于 +0.7
的值。如果您将该值更改为低于默认值的值,则会减弱该标签对网站排名的提升效果。如果以其他方式为标签分配负权重,该标签将降低或禁止网站。当您接近 -1.0
时,网站在搜索结果中的排名会越来越难。在 -1.0
,即使是排名较高的网站也很难克服严重的降位。
下表演示了如何根据标签的模式和权重调整结果。
模式 | 重量 | 效果 |
---|---|---|
BOOST |
+1.0 |
大力宣传网站。但是,这并不一定意味着添加了代码的网站在任何时候都会是显示在搜索结果上方的页面中,也并不一定意味着其他网站会被排除。这与将模式设置为 FILTER 不同。即使结果与标签不匹配,也可能会显示结果。与搜索查询更相关的结果可能仍然胜过您深受其喜爱的但不相关的网站。如果您强烈认为,在排除所有其他结果的情况下,使用高权重标签标记的网站应该排在最前面,那么您应该使用过滤器标签,而不是增强标签。 |
BOOST |
-1.0 |
大幅降位。这与将模式设置为 ELIMINATE 不同,因为可能仍会显示具有高度相关性的结果。
网站将与上游争夺较高排名,但并未完全被屏蔽。 |
BOOST |
未定义 | 如果您未定义权重(例如 <Label name="standard" mode="BOOST"/> ),其隐式权重为 +0.7 。 |
FILTER |
+1.0 |
对所选网站进行大幅度宣传。当模式设置为 FILTER 时,可编程搜索引擎将仅显示与该标签匹配的网站。因此,如果您选择的网站均与用户查询无关,系统将不会显示任何结果。 |
FILTER |
-1.0 |
有效阻止所选网站在搜索结果中显示。就像您已用“消除”标签标记了该网站。 |
FILTER |
未定义 | 如果您未定义权重(例如 <Label name="standard" mode="FILTER"/> ),其隐式权重为 +0.7 。 |
ELIMINATE |
无体重 | 屏蔽相应网站。系统不会显示与该标签匹配的网站。如果所有相关结果恰好带有“排除”标签,结果页可能为空。使用过滤器类型的搜索引擎(而非提升型搜索引擎)更容易发生这种情况。 |
您可以创建多个具有不同权重的标签,并根据需要将这些标签应用于网站。例如,您可能需要创建一个用于强力宣传网站的标签,另一个用于轻微宣传网站的标签。您可以根据需要创建任意数量的加权标签,但在特定的时间点之后,它们可能会变得难以管理。如需更精细地控制网站排名,一种更好的方法是通过得分,我们将在下一部分中进行讨论。
使用标签标记网站
定义标签后,您就可以开始用它们标记网站了。每个注释可以有多个标签,这意味着同一网站可用于其他搜索引擎,并且排名不同。
<Annotations> <Annotation about="webcast.berkeley.edu/*" score="1"> <Label name="cse_university_boost_highest"/> <Label name="cse_bicycles_exclude"/> <Label name="cse_hamsters_filter"/> </Annotation> </Annotations>
调节标签的效果
通过评分,您可以调节标签的影响。它们可以抑制或逆转这些标签对特定网站的影响。Annotation
元素的 score
属性的值可以从 -1.0
到 1.0
。值为 0
表示消除该标签对网站排名的影响;值为 1
表示完全影响;值为 -1
则完全逆转上述影响。介于 0
和 1
或 -1
和 0
之间的值(例如,0.55
)用于微调标签的影响。如果不为注释指定得分,自定义搜索会将标签的全部效果应用于网站。就像您为它指定的得分为 1
。
下表演示了得分如何调整标签的影响:
模式 | 重量 | 得分 | 效果 |
---|---|---|---|
不限 | 不限 | 无 | 这与为注解指定 1.0 得分相同。该标签会完整应用到该网站。 |
BOOST |
+1.0 |
-1.0 |
这与反转 BOOST 标签并为其赋予权重 -1.0 相同。主动将网站降位。 |
BOOST |
-1.0 |
-1.0 |
这与反转 BOOST 标签并为其赋予权重 +1.0 相同。积极宣传网站。 |
FILTER |
+1.0 |
-1.0 |
这与使用 ELIMINATE 标签为网站添加代码的方法相同。而是完全排除相应网站。 |
FILTER |
-1.0 |
-1.0 |
这与反转 FILTER 标签并为其赋予权重 +1.0 相同。积极宣传网站。 |
ELIMINATE
|
无体重 | -1.0 |
这与将 ELIMINATE 标签转换为得分为 +1.0 的过滤条件标签相同。积极宣传网站。 |
示例:得分代码
在以下示例中,我们有三个网站标记了相同的搜索引擎标签。但是,标签在三个不同网站上的效果不一样,因为每个注释具有不同的分数,应用强度不同的标签。
<Annotations> <Annotation about="*.edu/*" score="0.0001"> <Label name="vision_label"/> </Annotation> <Annotation about="*.ucsd.edu/*" score="0.7"> <Label name="vision_label"/> </Annotation> <Annotation about="*.vision.ucsd.edu/*" score="1"> <Label name="vision_label"/> </Annotation> </Annotations>
尽管这三种注释都具有 vision_label
标记,但可编程搜索引擎会根据其分数对它们进行不同的处理。来自 vision.ucsd.edu
的结果更受青睐;来自 ucsd.edu
的结果更受青睐;来自 .edu
顶级网域的结果略高于其他网站。