抓取和索引编制主题概览
这部分介绍了如何控制 Google 对您内容的查找和解析以使其显示在 Google 搜索和其他 Google 产品和服务中,以及如何阻止 Google 抓取您网站上的特定内容。
以下是每个网页的简介。如需大致了解抓取和索引编制功能,请参阅我们的 Google 搜索的运作方式指南。
主题 |
Google 编入索引的文件类型 |
Google 可将大多数类型的网页和文件内容编入索引。查看 Google 搜索可编入索引的最常见文件类型的列表。 |
网址结构 |
建议您组织一下内容,使网址结构合乎逻辑并易于人们理解。 |
站点地图 |
将网站上新增或更新的网页告知 Google。 |
抓取工具管理 |
|
robots.txt |
robots.txt 文件规定了搜索引擎抓取工具可以/无法请求抓取您网站上的哪些网页或文件。 |
规范化
|
了解什么是网址规范化,以及如何将您网站上的重复网页告知 Google,以避免过度抓取。了解 Google 如何自动检测和处理重复内容,以及如何将规范网址分配到发现的重复网页群组中。
|
移动网站 |
了解如何针对移动设备优化您的网站,并确保您的网站能被正确抓取和编入索引。 |
AMP |
如果您有 AMP 网页,可通过相应网页了解 AMP 在 Google 搜索中的运作方式。 |
JavaScript |
在设计网页和应用时需要考虑一些差异和限制,以适应抓取工具访问和呈现您的内容的方式。
|
页面和内容元数据 |
|
移除 |
|
网站迁移和变更 |
|
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-02-17。
[null,null,["最后更新时间 (UTC):2025-02-17。"],[[["This section explains how to control which content Google can find, parse, and show in search results."],["Learn how to submit new or updated pages, manage crawl rate, and block specific content from Google."],["Discover best practices for URL structure, sitemaps, canonicalization, and mobile optimization."],["Understand how Google handles various file types, JavaScript, and metadata for indexing."],["Explore tools for removing content, managing site moves, and optimizing for AMP."]]],["This content details how to manage Google's crawling and indexing of website content. Key actions include: using sitemaps to inform Google of new/updated pages, structuring URLs logically, and utilizing `robots.txt` to specify crawlable content. You can ask Google to recrawl URLs, manage faceted navigation, and handle duplicate content via canonicalization. The content also covers optimizing for mobile, AMP, JavaScript, metadata, removals, and site changes, including redirects and temporary site pauses. It also lists the indexable file types.\n"]]