控制与 Google 分享的内容

您可以控制 Google 在您的网站上看到的信息以及在 Google 搜索结果中显示的信息。您可能会出于以下原因而希望阻止 Google 访问您的某些内容:

  • 保护数据的私密性:您可能在自己的网站上托管了不希望其他用户访问的不公开数据。您可以阻止 Google 抓取此类数据,使其不会显示在搜索结果中。
  • 避免向受众群体显示价值不大的内容

    您的网站可能在不同位置有相同的内容,这可能会对您的网页在 Google 搜索中的排名产生负面影响。例如,如果网站提供了网站级搜索功能来帮助用户浏览网站内容,就会出现重复内容。某些搜索功能会在每次用户输入查询字词时生成并显示自定义搜索结果页。如果您不阻止 Google 访问这些自定义搜索结果页,Google 就会逐个抓取所有这些结果页。最终 Google 会认为网站中包含许多类似的网页,且可能会将重复内容归为垃圾内容,这可能会导致网页在 Google 搜索中的排名下降。

    您的网站可能转载了其他第三方来源生成的信息,这些信息会显示在网络上的其他地方。Google 认为将包含大量重复内容的网页收录到 Google 搜索结果中的价值不大。您可以屏蔽复制的内容来改善 Google 看到的内容质量,从而提高您的网页在 Google 搜索中的排名。

  • 让 Google 专注于您的重要内容:如果您的网站非常庞大(数千个网址),且具有内容不太重要的网页,或者有大量重复内容,则可能需要阻止 Google 抓取重复或重要性较低的网页,从而使其专注于更重要的内容。

如何屏蔽内容

以下是阻止内容显示在 Google 中的主要方式:

方法

移除内容

适用于所有内容类型

要想避免让内容出现在 Google 搜索中或任何地方,最可靠的方法是将其从网站中移除。如果相应信息已显示在 Google 搜索结果中,您可能需要采取额外的措施来永久移除该信息。

通过密码保护文件

适用于所有内容类型

如果您不希望自己的机密或私人内容出现在 Google 搜索结果中,那么最简单有效的方法就是将这些内容存储在网站服务器上用密码保护的目录中,以防止私密网址显示在搜索结果中。Googlebot 和其他所有网页抓取工具都无法访问用密码保护的目录中的内容。

高级用户:如果您使用的是 Apache 网络服务器,可以修改 .htaccess 文件来用密码保护服务器上的目录。网络上有许多工具可协助您执行此操作。

robots.txt 和/或紧急图片移除请求

适用于图片

使用 robots.txt 规则屏蔽图片

noindex 指令

适用于网页

noindex 是一种技术,用来指示 Google 不要读取您的网页,或让网页不要显示在 Google 搜索结果中。用户仍然可以通过其他网页链接到您的网页,或直接输入链接来访问您的网页,但您的网页不会显示在 Google 搜索结果中。此方法对技术要求较高,如果您使用内容管理系统托管网站,可能无法使用此方法。

停用特定的 Google 产品和服务

适用于网页

您可以告知 Google 不要将您网站上的内容包含在特定的(而非所有的)Google 产品和服务中。

nosnippet 元标记

适用于搜索结果摘要

您可以将 <meta name="robots" content="nosnippet" /> 标记添加到网页的 HTML head 部分,防止摘要出现在搜索结果中。 但请注意,这会在搜索结果中生成令人困惑的消息(“没有此网页的信息”)。

网址参数工具

适用于网页、网站版块、网址格式

资深用户可以使用网址参数工具阻止抓取包含特定参数的网址。我们仅建议非常资深的用户使用此方法,因为此方法可能会屏蔽您网站的很大一部分网址空间,导致出错时难以调试。

从 Google 搜索结果中移除现有内容

了解如何从 Google 搜索结果中移除托管在您网站上的网页