Google索引诀窍揭秘
2012年8月8日星期三
发表者:
Kristen Dwan
,
Victoria Shan
,
Javier Tordable
,网站管理员工具团队
原文:
Behold Google index secrets, revealed!
自从Googlebot问世以来,世界各地的网站站长们一直在问这样一个问题:Google,我的网页被索引了吗?现在,有了网站管理员工具的新 “
索引状态
”功能,是时候回答这个问题了。不管是一个还是一百万个,“索引状态”都会清楚地告诉您
Google索引
中收录的您的网页数量。
“索引状态”选项位于“运行状况”菜单下。点击后,您会看到如下统计图:
这份统计图显示了目前索引的网页数量。图例表明的是最新统计数目,曲线图则可展示长达一年的数据。
如果您看到索引网页数量持续稳定增长,那么祝贺您!这就足以证明您网站上的新内容已被Google发现、抓取并索引。
不过,也许有人会发现一些问题,有待深入探究。所以我们在该功能上添加了一个“高级”选项。您可以通过点击顶部的按钮访问,进入后会看到如下页面:
“高级”选项中不仅会显示索引网页总数,还会显示抓取页面累计数量、被robots.txt文件拦截而未被抓取的网页数量,以及未被选入搜索结果中的网页数量。
请注意,所有的计数都是总数。举例来说,在6月17日这一天,如果显示的索引网页数量是92,这意味着在当前时间点共有92个网页被索引,而不是说当天只有92个网页被添加到索引中。特别是对有着悠久历史的网站来说,抓取的网页数量可能会远远大于索引的网页数量。
这些数据都可用来识别和解决各种与索引相关的问题。例如,如果您的某些网站不再出现在Google搜索结果中,且您注意到被索引网页的曲线图出现骤降点,这可能表明您在使用meta=”noindex”的时候出现了涉及整个网站的错误,导致Google无法将您的网站内容包含在搜索结果中。
再举一个例子:如果您改变了自己网站的URL结构,并且没有按照我们提供的关于
网站迁移的建议
进行操作,那么您可能会看到“未选”(“Not selected”)这一项的计数出现大幅下降。在这种情况下,应该修复重定向或rel=”canonical”标签以获得更好的索引覆盖。
我们希望“索引状态”功能可以提高Google索引选择过程的透明度,帮助您识别并修复网站的索引问题。如果您有任何疑问,请随时登录我们的
帮助论坛
进行咨询。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2012-08-01。
[null,null,["最后更新时间 (UTC):2012-08-01。"],[[["Google Webmaster Tools' new Index Status feature allows webmasters to see how many of their site's pages are in Google's index."],["The feature provides a graph showing the number of indexed pages over time, helping to identify indexing trends and potential issues."],["An Advanced tab offers further insights, including the number of crawled pages, pages blocked by robots.txt, and pages not selected for inclusion in search results."],["This data can be used to diagnose indexing problems, such as sudden drops in indexed pages or increases in \"Not selected\" pages, allowing webmasters to take corrective action."]]],["The new Index Status feature in Google Webmaster Tools shows how many pages from a site are in Google's index, displayed in a graph with up to one year of data. The advanced tab provides totals of indexed pages, crawled pages, pages blocked by robots.txt, and pages not selected for inclusion. This data helps identify indexing problems like site-wide errors, incorrect use of meta tags, or issues from URL structure changes. Fixing these issues improves indexing coverage.\n"]]