Google 编入索引的文件类型

Google 可以将大多数文本文件和某些已编码文档格式的内容编入索引。文件类型由 Google 抓取文件时返回的 Content-Type HTTP 标头确定,不过在某些情况下,如果 Content-Type 标头缺失或不正确,Google 可能会使用文件扩展名或使用其他解析器重新解析文件。

支持的平面文件类型

支持以下平面文件类型。这些文件的内容以未编码的纯文本形式存储(不过它们可能会使用标记)。

  • 以逗号分隔的值 (.csv)
  • Google 地球(.kml、.kmz)
  • GPS 交换格式 (.gpx)
  • HTML(.htm、.html、其他文件扩展名)
  • 可缩放矢量图形 (.svg)
  • TeX/LaTeX (.tex)
  • 文本文件(.txt、.text、其他文件扩展名),包括采用常用编程语言的源代码,例如:
    • Basic 源代码 (.bas)
    • C/C++ 源代码(.c、.cc、.cpp、.cxx、.h、.hpp)
    • C# 源代码 (.cs)
    • Java 源代码 (.java)
    • Perl 源代码 (.pl)
    • Python 源代码 (.py)
  • 无线标记语言(.wml、.wap)
  • XML (.xml)

支持的编码文件类型

支持以下编码文件类型。这些是二进制文件或复杂的容器,需要使用特定的解析器才能提取人类可读的文本。

  • Adobe 便携式文档格式 (.pdf)
  • Adobe PostScript (.ps)
  • 电子出版物 (.epub)
  • Hancom Hanword (.hwp)
  • Microsoft Excel(.xls、.xlsx)
  • Microsoft PowerPoint(.ppt、.pptx)
  • Microsoft Word(.doc、.docx)
  • OpenOffice 演示文稿 (.odp)
  • OpenOffice 电子表格 (.ods)
  • OpenOffice 文本文件 (.odt)
  • 富文本格式 (.rtf)

支持的媒体格式

Google 还可以将以下媒体格式的内容编入索引:

  • 图片格式: BMP、GIF、JPEG、PNG、WebP、SVG 和 AVIF
  • 视频格式: 3GP、3G2、ASF、AVI、DivX、M2V、M3U、M3U8、M4V、MKV、MOV、MP4、MPEG、OGV、QVT、RAM、RM、VOB、WebM、WMV 和 XAP

按文件类型搜索

您可以在 Google 搜索中使用 filetype: 运算符,将搜索结果限制为特定文件类型或文件扩展名。例如,filetype:rtf galway 会搜索以 .rtf 结尾且内容包含“galway”一词的 RTF 文件和网址。