在更改网址的情况下迁移网站

本文介绍了如何更改网站上现有网页的网址,同时最大限度降低对 Google 搜索结果产生的影响。以下是一些此类网站迁移的示例:

  • 网址从 HTTP 更改为 HTTPS
  • 域名更改,如将 example.com 更改为 example.net,或者合并多个域名/主机名
  • 网址路径更改:将 example.com/page.php?id=1 更改为 example.com/widget,或将 example.com/page.html 更改为 example.com/page.htm

概览

  1. 查看网站迁移方面的基本信息。了解会出现的情况,以及迁移对您的用户和排名可能会有何影响。如需从 HTTP 迁移到 HTTPS,请参阅 HTTPS 最佳做法
  2. 准备新网站并对其进行全面测试。
  3. 准备网址映射,从当前网址映射到对应的新格式。
  4. 通过将服务器配置为从旧网址重定向至新网址,开始网站迁移
  5. 监控新旧网址的流量

有关在更改网址的情况下迁移网站的常见问题解答

  • Google 建议您一起迁移所有内容,还是按版块迁移?
    可以按版块迁移。
  • 如何测试有多少个网页编入了索引?
    您可以在 Search Console 中分别验证每个资源的数据。通过“索引状态”报告可进行全面检查。通过站点地图报告可查看站点地图中提交的网址有多少个编入了索引。
  • Google 需要多长时间才能识别网址更改?
    我们没有固定的抓取频率;这需要根据您的网站规模以及可能的抓取速度来定。迁移操作实际上是逐个网址地迁移。
  • 重定向到新网址后,链接的信誉度是否会降低?
    不会,301 或 302 重定向不会造成 PageRank 的降低。

从 HTTP 迁移到 HTTPS

  • 查看 HTTPS 最佳做法
  • 确保将 HTTPS 资源添加到 Search Console 中。Search Console 会分别处理 HTTP 和 HTTPS;这些资源的数据不会在 Search Console 中共享。因此,如果您有这两种协议的网页,则必须为每种协议分别建立一个 Search Console 资源。

有关从 HTTP 迁移到 HTTPS 的常见问题解答

此次 HTTPS 迁移是否会影响排名?

与所有迁移一样,您网站的排名可能会在迁移过程中出现一些波动。不过,为了避免 HTTPS 所特有的问题,请查看 HTTPS 网页最佳做法信息

HTTPS 网站的排名会略有提升,但变化不会很明显。 Google 将 HTTPS 用作一种积极的排名信号。不过,此信号仅是众多排名相关因素中的一种,而且目前所具有的影响力尚不及优质网站内容;所以在短期内,您不应期望通过迁移到 HTTPS 获得较大的搜索引擎优化 (SEO) 优势。从长远来看,Google 可能会提升 HTTPS 对排名的正面影响力。

是否可以仅将部分网页迁移到 HTTPS?

是的,您可以先迁移部分内容,进行测试,然后再按照自己的进度迁移更多内容。

如果您要按版块从 HTTP 迁移到 HTTPS,且想避免分阶段迁移网址的早期索引编制问题,建议您使用 rel=canonical 而不是重定向。如果您使用重定向,将无法测试重定向的网页。

rel=canonical 标记能否保证系统会将 HTTP 网址编入索引?

不能,但在选择编入索引的网址时,这是一个非常重用的信号。

Google 推荐哪个证书?

对于 Google 搜索而言,新型浏览器接受的所有现代证书都是可以的。

迁移到 HTTPS 后,搜索关键字是否会发生变化?

迁移到 HTTPS 后,这一点不会改变;您仍然可以在 Search Console 中看到搜索查询。

我如何测试有多少个网页编入了索引?

在 Search Console 中单独验证 HTTP 和 HTTPS 网页,并在“索引涵盖范围”报告中查看哪些网页已编入索引。

从 HTTP 迁移到 HTTPS 需要多长时间?

我们没有固定的抓取频率;这需要根据您的网站规模以及可能的抓取速度来定。迁移操作实际上是逐个网址地迁移。

我们在 robots.txt 中引用了 HTTP 站点地图。是否应将 robots.txt 更新为包括新的 HTTPS 站点地图?

我们建议您将 robots.txt 文件更新为指向 HTTPS 版本的站点地图文件。我们还建议您仅在站点地图中列出这些 HTTPS 网址。

请注意,即使您将网站上的每个网址都从 HTTP 重定向到 HTTPS,抓取工具仍然只能访问一个 robots.txt 文件。例如,如果 http://example.com/robots.txt 重定向到 https://example.com/robots.txt,那么 Google 和其他搜索引擎将无法看到 HTTP 版本的内容。

哪个站点地图应该映射试运行的 HTTPS 版块?

您可以仅为网站上更新的版块单独创建站点地图。这样一来,您可以更精确地跟踪试运行版块的索引编制。但请勿将这些网址复制到其他任何站点地图中。

如果我们有重定向(从 HTTP 到 HTTPS 或从 HTTPS 到 HTTP),站点地图中应列出哪些网址?

在您的站点地图中列出所有新的 HTTPS 网址,并移除旧的 HTTP 网址。如果您希望创建新的站点地图,请仅在其中列出新的 HTTPS 网址。

我们是否需要针对 HTTPS 版本的 robots.txt 添加其他任何特定内容?

不需要。

我们是否应该支持 HSTS?

HSTS 可以提高安全性,但会令您的回滚策略更复杂。如需了解详情,请查看 HTTPS 最佳做法

我们为整个网站使用了一个 Google 新闻站点地图。如要按版块迁移网站,该怎么办?

如果您想为新 HTTPS 版块使用 Google 新闻站点地图,则必须与新闻团队联系,向对方说明协议更改情况,然后当您将网站的每个版块都迁移到 HTTPS 时,您可以在 Search Console 中的 HTTPS 资源中提交新的 Google 新闻站点地图

在向 HTTPS 迁移过程中,是否有任何 Google 新闻发布商中心方面的具体建议?

Google 新闻发布商中心会透明地处理从 HTTP 到 HTTPS 的迁移。通常,从 Google 新闻角度来说,您不必采取任何操作,除非您同时使用了新闻站点地图。在这种情况下,请与新闻团队联系,向对方说明更改情况。此外,您也可以向团队说明要更改的版块,例如,如果您要迁移到 HTTPS,可以指出您要从 http://example.com/section 迁移到 https://example.com/section

准备新网站

每种网站迁移操作的准备细节各不相同,不过您通常需要执行以下一项或多项操作:

  • 设置新的内容管理系统 (CMS) 并向其中添加内容。
  • 转移您当前托管的图片和下载内容(如 PDF 文档)。
    这些内容可能已经从 Google 搜索或链接中获取流量,因此有必要将其新位置告知用户和 Googlebot。
  • 要迁移至 HTTPS,您必须获取所需的 TLS 证书并在服务器上进行配置。

为新网站设置 robots.txt 文件

网站的 robots.txt 文件能够控制 Googlebot 可抓取的范围。请确保新网站的 robots.txt 文件中的指令正确反映了您想要禁止抓取的部分。

请注意,某些网站所有者会在开发期间禁止抓取任何内容。如果您采取这种策略,请务必准备好在网站迁移开始时要使用的 robots.txt 文件。同样,如果您在开发期间使用 noindex 指令,请准备好开始网站迁移时需从中移除 noindex 指令的网址列表。

针对已删除或已合并的内容提供错误消息

对于不会被转移到新网站的旧网站内容,请确保这些孤立网址能够正确返回 HTTP 404 或 410 错误响应代码。您可以在新网站的配置面板中进行设定,让这些旧网址返回错误响应代码,或者为新网址创建重定向并使其返回 HTTP 错误代码。

确保 Search Console 设置正确无误

成功的网站迁移取决于正确且最新的 Search Console 设置。

如果您尚未进行设置,请在 Search Console 中验证您是旧网站和新网站的所有者。请务必验证新旧网站的所有变体。例如,验证 www.example.comexample.com,如果您使用的是 HTTPS 网址,还需要验证 HTTPS 和 HTTP 网站变体。请务必分别对旧网站和新网站执行此操作。

检查 Search Console 验证状态

确保您的 Search Console 验证状态在网站迁移之后将会继续有效。如果您使用的是其他验证方法,请注意验证令牌可能会随着网址的更改而发生变化。

如果您在 Search Console 中使用 HTML 文件方法验证您对网站的所有权,请不要忘记将当前验证文件加入到网站的新副本中。

同样,如果您通过引用元标记Google Analytics(分析)的包含文件验证所有权,请确保新的 CMS 副本中也包含这些内容。

检查 Search Console 中所有已配置的设置

如果您已经在 Search Console 中针对旧网站更改了某些配置设置,请确保更新新网站的设置以反映这些更改。例如:

  • 网址参数:如果您已经配置了网址参数,以便控制如何抓取旧网址或将其编入索引,请确保相关设置也应用到新网站(如果需要)。
  • 地理位置定位:您的旧网站可能具有明确的地理位置定位,例如可进行地理位置定位的域名或包含国家/地区代码的顶级域名(例如 .co.uk)。如果您要继续定位到相同的地区,请将相同的设置应用到新网站。但是,如果您迁移网站的目的是为了在全球范围内扩展业务,并且您不想将网站与任何国家或地区关联,那么请在“网站设置”页的下拉列表中选择未列出
  • 抓取速度:我们建议您不要在 Search Console 中针对新旧网址对 Googlebot 的抓取速度进行任何限制。此外,您最好也不要对抓取速度设置进行配置。只有当您知道自己的网站无法应对 Googlebot 的抓取量时,您才可以进行此项操作。如果您已经限制了 Googlebot 对旧网站的抓取速度,建议您取消这项限制。Google 的算法可以自动检测到网站迁移是否已实施,并且我们也会改变 Googlebot 的抓取行为,使我们的编入索引操作快速反映网站迁移。
  • 已拒绝的反向链接:如果您已经上传一个拒绝旧网站链接的文件,我们建议您使用新网站的 Search Console 帐号重新上传该文件。

清理近期购买的域名

如果您的新网站使用的是近期购买的域名,您应该确保前任所有者未遗留任何问题。请检查以下设置:

  • 对之前的网络垃圾进行的手动操作。对于不符合我们的网站站长指南的网站,Google 将会采取手动操作,如对其进行降位,甚至将其从我们的搜索结果中完全移除。请查看 Search Console 中的“手动操作”页,确定是否有任何手动操作已应用到新网站,并解决该页面上列出的所有问题,然后提交重新审核请求
  • 已移除的网址。确保前任所有者未遗留任何需要移除的网址,尤其是网站级的网址。此外,在针对您的内容提交网址移除请求前,请确保您了解哪些情况下不应使用网址移除工具

使用网络分析

在网站迁移过程中,分析新旧网站的使用情况非常重要。网络分析软件可以帮助您做到这一点。通常情况下,网络分析配置包括嵌入到您网页中的一段 JavaScript 代码。有关跟踪不同网站的详情会因分析软件及其日志记录、处理或过滤设置而有所不同。请咨询您的分析软件提供商以获得帮助。此外,如果您一直计划对分析软件进行配置更改,现在无疑是个好时机。如果您使用的是 Google Analytics(分析),并且想在内容报告中实现完全分隔,建议您为新网站创建新的配置文件。

确保您的服务器有足够的计算资源

迁移完成后,Google 会比平时更频繁地抓取您的新网站。这是因为网站会将流量从旧网站重定向至新网站,并且对旧网站的所有抓取都会重定向至新网站,在任何其他抓取之外造成额外负担。请确保新网站拥有充足的容量,能够处理来自 Google 的更多流量。

更新数据标注工具

如果您使用数据标注工具映射旧网页,请务必为新网站重新建立映射。

在 HTTPS 网页准备就绪后,请立即更新在 Google 搜索结果中显示时用于在应用中打开您网页的所有应用链接。请将这些链接更新为指向新的 HTTPS 网址。重定向对这些链接不起作用;除非您更新应用链接处理方式,否则在移动浏览器中进行点击会在浏览器中(而不是在应用中)打开网页。

将旧网站的网址映射到新网站的网址非常重要。此部分介绍了一些可用于正确评估新旧两个网站上的网址以及帮助您建立映射的常规方法。有关生成此映射的准确详情会因当前网站基础架构以及网站迁移的细节而有所不同。

准备网址映射

将旧网站的网址映射到新网站的网址非常重要。此部分介绍了一些可用于正确评估新旧两个网站上的网址以及帮助您建立映射的常规方法。有关生成此映射的准确详情会因当前网站基础架构以及网站迁移的细节而有所不同。

1. 确定您的当前网址

在最简单的网站迁移情形中,您可能并不需要生成当前网址列表。例如,如果您要更改网站的域名(例如从 example.com 更改为 example.net),那么您可以使用通配符服务器端重定向。

在更为复杂的网站迁移中,您需要生成旧网址列表,并将其映射到相应的新目标网址。获取旧网址列表的方式取决于当前网站的配置,下面提供了一些方便实用的技巧:

  • 从重要的网址开始。要找出这些网址,请执行以下操作:
    • 站点地图中查找,因为最重要的网址很可能就是已通过站点地图提交到 Search Console 中的网址
    • 查看服务器日志或使用分析软件,找出流量最高的网址
    • 利用 Search Console 中提供的“指向您网站的链接”功能,找出包含内外部链接的网页
  • 使用内容管理系统,该系统通常可让您轻松获得托管内容的所有网址的列表。
  • 查看服务器日志,找出近期至少访问过一次的网址。选择适合您网站的一个时间段,并注意流量的季节性波动。
  • 加入图片和视频,确保您在网站迁移计划中加入了嵌入内容(视频、图片、JavaScript 和 CSS 文件)的网址。这些网址的迁移方式需要与网站上所有其他内容的迁移方式相同。

2. 创建从旧网址到新网址的映射

获取旧网址列表后,即可决定每个网址应该重定向至哪个目标网址。您存储此映射的方式取决于您的服务器及网站迁移。对于常见的重定向模式,您可以使用数据库或在您的系统上配置一些网址重写规则。

3. 更新所有网址详情

定义网址映射后,您需要完成三项工作,为迁移做好网页准备。

  1. 针对每个网页更新 HTML 或站点地图条目中的注解
    1. 每个目标网址都应该有一个自引用 rel="canonical" <link> 标记。
    2. 如果您迁移的网站包含多语言或多地区版本且使用了 rel-alternate-hreflang 注解的网页,请务必更新这些注解,以便使用新网址。
    3. 如果您迁移的网站有对应的移动版本,请务必更新 rel-alternate-media 注解。如需了解详情,请参阅我们的智能手机网站指南
  2. 更新内部链接
    将新网站上的内部链接从旧网址更改为新网址。您可以根据需要使用之前生成的映射帮助查找和更新链接。
  3. 创建并保存站点地图及链接列表。
    保存以下列表,以便进行最终的网站迁移:
    • 包含映射中新网址的站点地图文件
    • 链接到当前内容的网站列表

4. 为 301 重定向做好准备

在定义好映射且新网站准备就绪后,下一步就是在服务器上依据指示的映射关系,设置从旧网址到新网址的 HTTP 301 重定向

请注意以下几点:

  • 使用 HTTP 301 重定向。虽然 Googlebot 支持多种重定向,但我们建议您尽量使用 HTTP 301 重定向。
  • 避免使用重定向链。虽然 Googlebot 和各个浏览器能够追踪由多个重定向组成的“链”(例如,网页 1 > 网页 2 > 网页 3),但我们建议您直接重定向至最终目标网址。如果无法做到这一点,请尽量减少重定向链中的重定向次数,最好是不超过 3 次,且要尽量小于 5 次。重定向链会增加用户的等待时间,而且并非所有浏览器都支持较长的重定向链。
  • 测试重定向。您可以使用网址检查工具测试单个网址,或者使用命令行工具或脚本测试大量网址。

开始网站迁移

待网址映射已准确创建且重定向已正常运行后,就可以开始迁移网站了。

  1. 确定如何迁移网站 - 是一次性迁移,还是按版块迁移:
    • 中小型网站:我们建议您同时迁移网站上的所有网址,而不是一次仅迁移一个版块。这既有助于用户与新形式的网站更好地互动,也有助于我们的算法更快速地检测到网站迁移并更新索引。
    • 大型网站:您可以选择一次迁移一个版块。这样更便于监控和检测问题,以及更快速地修正问题。
  2. 更新 robots.txt 文件
    • 在旧网站上,移除所有 robots.txt 指令。 此操作会使 Googlebot 发现所有指向新网站的重定向并更新我们的索引。 请注意,如果您启用了重定向,抓取工具将不会看到旧 robots.txt 文件的内容。
    • 在新网站上,确保 robots.txt 文件允许所有抓取操作。这包括抓取图片、CSS、JavaScript 和其他网页资源,您确定不想抓取的网址除外。
  3. 配置旧网站,以便根据网址映射将用户和 Googlebot 重定向至新网站
  4. 在 Search Console 中针对旧网站提交地址更改请求
  5. 尽可能长时间保留重定向,通常保留至少 1 年。 在此期间,Google 会将所有信号都转移给新网址,包括重新抓取和重新分配其他网站上指向您的旧网址的链接。

    从用户的角度来看,不妨考虑无限期地保留重定向。但是,重定向对于用户来说速度较慢,因此请尽力将您自己的链接和所有来自其他网站的高流量链接更新为指向新网址。

  6. 在 Search Console 中提交新的站点地图。这有助于 Google 了解新网址。此时,您可以移除旧的站点地图,因为 Google 今后将使用新站点地图。

Googlebot 及我们的系统需要花费一段时间才能发现并处理网站迁移中的所有网址,所需的具体时间将取决于您服务器的速度和所涉网址的数量。一般来说,中型网站可能需要几周的时间才能迁移大多数网页,大型网站则可能需要更长的时间。Googlebot 和我们的系统发现及处理已迁移网址的速度取决于网址数量和服务器速度。

在网站迁移开始后,请立即尝试更新尽可能多的传入链接,以改善用户体验并降低服务器负载。其中包括:

  • 外部链接:设法与链接至您当前内容的已保存网站列表中的网站取得联系,请求他们将原来的那些链接更新为指向您的新网站。建议您根据每个链接所能带来的入站访问量安排工作优先级。
  • 来自 Facebook、Twitter 及 LinkedIn 等的个人资料链接。
  • 指向新着陆页的广告系列。

监控流量

开始迁移网站后,监控新旧网站的用户和抓取工具流量变化情况。理想情况下,旧网站的流量会下降,而新网站的流量会增加。您可以使用 Search Console 和其他工具监控网站上的用户和抓取工具活动。

使用 Search Console 监控流量

Search Console 中的许多功能都可以帮助您监控网站迁移过程,其中包括:

  • 站点地图:提交您之前为映射关系保存的两份站点地图。最初,包含新网址的站点地图被编入索引的网页数量为零,而旧网址的站点地图会有很多网页被编入索引。慢慢地,包含旧网址的站点地图中被编入索引的网页数量会逐渐减少到零,而包含新网址的站点地图中被编入索引的网页数量会相应地增加。
  • “索引涵盖范围”报告:这些图表可反映网站迁移的情况,能够显示旧网站上被编入索引的网址数量逐渐减少,而新网站上被编入索引的网址数量逐渐增加。请定期查看此类报告,以便及时了解是否发生了任何意外的抓取错误。
  • 搜索查询:随着新网站上越来越多的网页被编入索引并开始加入排名,搜索查询报告会开始显示新网站上的网址获得的搜索展示次数及点击次数。

使用其他工具监控流量

请留意您的服务器访问和错误日志,尤其要仔细检查 Googlebot 的抓取活动、意外返回 HTTP 错误状态代码的任何网址以及正常的用户流量。

如果您已在自己的网站上安装了任意一款网络分析软件,或者如果您的 CMS 可以提供分析功能,我们也建议您通过这种方式查看流量,了解流量从旧网站转向新网站的进展。尤其是,Google Analytics(分析)可提供实时报告,这是一项非常适合在网站迁移初始阶段使用的便捷功能。在这类报告中,您应该会看到旧网站的流量逐渐下降,而新网站的流量逐渐增加。

排查网站迁移问题

下面列出了在更改网址的情况下迁移网站(包括从 HTTP 迁移到 HTTPS)时会出现的一些常见错误。这些错误可能会阻止系统将您的新网站完整地编入索引。

常见错误

noindex 或 robots.txt 屏蔽设置

请记得移除仅在迁移时需要使用的所有 noindex 或 robots.txt 屏蔽设置。

网站中可以没有 robots.txt 文件,但如果收到针对此文件的请求却无法提供,请务必快速返回正确的 404 状态代码。

测试方法

  • 检查 HTTPS 网站中的 robots.txt 文件,看看是否需要进行更改。
  • 使用网址检查工具检查 Google 似乎漏掉的新网站网页。

重定向不正确

检查从旧网站到新网站的重定向。我们经常看到重定向至新网站中的错误网址(不存在的网址)的情况。

其他抓取错误

仔细检查“索引涵盖范围”报告,看看在迁移期间,新网站中的其他错误是否出现了激增的情况。

容量不足

迁移完成后,Google 会比平时更频繁地抓取您的新网站。这是因为网站会将流量从旧网站重定向至新网站,并且对旧网站的所有抓取都会重定向至新网站,在任何其他抓取之外造成额外负担。请确保您的网站拥有充足的容量,能够处理来自 Google 的更多流量。

如果您想让用户在应用内打开您的网页,请先将应用链接更新为指向新网址,然后再实现从旧网页到新网页的重定向。否则,Google 不会建议使用应用打开搜索结果中的新网址,而是改为在浏览器中将用户定向至相应网站。

未更新站点地图

请确保您的站点地图中的网址已全部更新为新网址。

未更新数据标注工具

如果您使用数据标注工具映射旧网页,则需为新网站重新建立映射。