规范化是指选择一段内容的有代表性的规范网址的过程。因此,规范网址是指 Google 从一组重复网页中选出的最具代表性的网页的网址。此过程通常称为重复信息删除,有助于 Google 在搜索结果中仅显示重复内容的一个版本。
网站包含重复内容的原因有很多:
区域变体:例如,面向美国和英国的一段内容可通过不同的网址访问,但实质上是同一语言的相同内容
设备变体:例如,一个网页既有移动版又有桌面版
协议变体:例如,网站的 HTTP 版本和 HTTPS 版本
网站函数:例如,类别网页的排序函数和过滤函数的结果
意外变体:例如,网站的演示版本意外仍可供抓取工具访问
网站上的某些重复内容是正常的,并不违反 Google 的垃圾内容政策。但是,多个不同网址访问的是相同内容可能会导致用户体验不佳(例如,用户可能会想知道哪个是正确的网页,以及两者之间是否存在差异),可能会让您更难跟踪自己的内容在搜索结果中的表现。
Google 如何将网站编入索引并选择规范网址
Google 将网页编入索引时,会确定每个网页的主要内容(或“核心”)。如果 Google 发现多个网页似乎相同或者主要内容非常相似,则会根据索引编制流程收集的因素(或“信号”)来选择客观来说对搜索用户而言最完整、最实用的网页,并将其标记为规范网页。为了减少 Google 对网站的抓取工作量,我们会经常抓取规范网页,而不会频繁地抓取重复网页。
有一些因素会影响规范化:网页是通过 HTTP 还是 HTTPS 提供、重定向、站点地图中是否出现了相应网址,以及 rel="canonical"link 注释。您可运用上述方法告知 Google 您更愿意使用哪个网页,但 Google 仍可能会因各种原因另选一个网页作为规范网页。也就是说,指明首选规范网页是一个提示,而非规则。
[null,null,["最后更新时间 (UTC):2025-02-17。"],[[["Canonicalization is the process of choosing the best URL from a set of duplicate pages on a website."],["Google uses signals like HTTPS, sitemaps, and redirects to determine the canonical URL, aiming to show users the most relevant and complete version of a page."],["While website owners can suggest a preferred canonical URL, Google's algorithms may ultimately select a different URL based on various factors."],["Duplicate content arising from regional or device variations is common and not inherently problematic, but managing it can improve user experience and search performance."],["Google primarily uses the canonical version for content evaluation and search results, but may prioritize other versions (e.g., mobile) based on user context."]]],["Canonicalization is the process of selecting a representative URL for duplicate content. Google chooses the most complete and useful page as the canonical URL, indexing it more regularly. Duplicate pages may arise from region, device, protocol variants, site functions, or accidents. Factors like HTTP/HTTPS, redirects, sitemaps, and `rel=\"canonical\"` annotations influence Google's choice, though it can differ from site preferences. The canonical page is the primary source for content evaluation unless a duplicate better serves a user's specific context.\n"]]