巧妙利用site:操作符和Sitemap统计数据
使用集合让一切井井有条
根据您的偏好保存内容并对其进行分类。
2009年3月23日星期一
发表者:
Charlene Perez
, 搜索质量组
原文:
Using stats from site: and Sitemap details
发表于:2009年3月4日星期三,下午4:40
在与网站管理员相关的博客和论坛中,我们经常可以听到这样的讨论:网站管理员们对他们的网站进行[site:example.com]查询的时候,经常发现被索引的页面数量通常和网站管理员工具中的Sitemap报告展示的URL数量不一致。这种不一致看起来很像是一个bug,但实际上我们是有意这样设计的。您的Sitemap报告仅仅反映了您在Sitemap文件中提交的URL,而site:操作符则包含了所有Google已经抓取的您的网站上的 URL,这有可能包含一些没有囊括在您Sitemap文件内的URL,比如新添加的URL或其他通过跟踪链接而抓取到的URL。
您可以把site:操作符作为一个快速诊断您的网站整体健康情况的方法。site:操作符可以向您展示:
-
您的网站被索引的页面数量的粗略估计值
-
如果您的网站
被黑掉了
,那么您可以从中发现一些蛛丝马迹
-
观察您的网站有无重复的网页标题和内容摘要
下面是一个使用site:操作符的例子:

您的Sitemap报告提供了关于您提交的URL的详细统计数据,比如实际被索引的URL数目与请求被索引的URL数目,此外这份摘要还会显示Google尝试抓取您提供的URL时是否存在任何错误或错误提醒。

您可以通过阅读帮助中心关于
site:操作符
和
Sitemap
的帮助文章来进一步了解相关信息。如果您有进一步的问题,欢迎您到
谷歌网站管理员支持论坛
中发贴提问,那里有很多有经验的站长和谷歌员工乐意帮助您:-)
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2009-03-01。
[null,null,["最后更新时间 (UTC):2009-03-01。"],[],["The number of indexed results from a `site:example.com` query differs from a Sitemap report because the latter only reflects submitted URLs. The `site` operator, however, accounts for all crawled URLs, including those not in the Sitemap. This operator offers a general health check of a site in Google's index, providing a rough estimate of indexed pages, indicating potential hacks, and highlighting duplicate content. The Sitemap report gives detailed statistics on submitted URLs, like indexed vs. submitted numbers.\n"],null,[]]