Koleksiyonlar ile düzeninizi koruyun
İçeriği tercihlerinize göre kaydedin ve kategorilere ayırın.
Cloud Search, dosya türünden (MIME veya içerik türü) bağımsız olarak gönderilen tüm öğeleri dizine ekler. Dizine ekleme, bir dosyanın meta veri verileri ve destekleniyorsa içeriği üzerinde gerçekleştirilir. Aşağıda, içerik dizine eklemenin desteklendiği dosya türlerinin listesi verilmiştir.
Microsoft Word (DOC)
Microsoft Word (DOCX)
Microsoft Excel (XLS)
Microsoft Excel (XLSX)
Microsoft PowerPoint (PPT)
Microsoft PowerPoint (PPTX)
Adobe Taşınabilir Belge Biçimi (PDF)
Zengin Metin Biçimi (RTF)
Metin Biçimi (TXT)
Hypertext Biçimlendirme Dili (HTML)
Genişletilebilir Biçimlendirme Dili (XML)
Cloud Search, bu dosya türlerine ek olarak herhangi bir düz metin dosyasındaki içeriğin indekslenmesini de destekler.
Optik karakter tanıma (OCR) dosya türleri ve özellikleri
Google Cloud Search, aşağıdaki dosya türlerinden metin ayıklamak için de OCR kullanır:
Dosya türü
Maksimum boyut
Joint Photographic Experts Group (JPG)
10 MB
Grafik Değişim Biçimi (GIF)
10 MB
Etiketli Resim Dosyası Biçimi (TIFF)
10 MB
Ölçeklenebilir Vektör Grafiği (SVG)
10 MB
PostScript Görüntü Biçimi (PS)
10 MB
Taşınabilir Belge Biçimi (PDF)
30 MB
OCR, aşağıdaki özelliklere sahip dosyalarda da çalışır:
Elle yazılmış belgeler. Latin alfabesi, Japonca ve Korece yazılmış dokümanlar en iyi sonuçları verir.
Dikey olarak yazılmış dokümanlar (ör. Japonca dokümanlar).
[null,null,["Son güncelleme tarihi: 2025-08-29 UTC."],[],[],null,["# Supported file types for text extraction\n\nCloud Search indexes all items that are sent, regardless of file type\n(MIME or content-type). Indexing is performed on a file's metadata data and,\nif supported, its content. Following is a list of file types for which content\nindexing *is* supported.\n\n- Microsoft Word (DOC)\n- Microsoft Word (DOCX)\n- Microsoft Excel (XLS)\n- Microsoft Excel (XLSX)\n- Microsoft Powerpoint (PPT)\n- Microsoft Powerpoint (PPTX)\n- Adobe's Portable Document Format (PDF)\n- Rich Text Format (RTF)\n- Text Format (TXT)\n- Hypertext Markup Language (HTML)\n- Extensible Markup Language (XML)\n\nIn addition to these file types, Cloud Search supports indexing of content\nwithin any plain text file.\n\nOptical Character Recognition (OCR) file types and characteristics\n------------------------------------------------------------------\n\nGoogle Cloud Search also uses OCR to extract text from the following file types:\n\n| File type | Maximum size |\n|----------------------------------------|--------------|\n| Joint Photographic Experts Group (JPG) | 10 MB |\n| Graphic Interchange Format (GIF) | 10 MB |\n| Tagged Image File Format (TIFF) | 10 MB |\n| Scalable Vector Graphics (SVG) | 10 MB |\n| PostScript Image Format (PS) | 10 MB |\n| Portable Document Format (PDF) | 30 MB |\n\n| **Note:** Cloud Search uses OCR for PDF files only when indexing in `ASYNCHRONOUS` mode, and applies OCR to the first 80 pages of the PDF file. To be eligible for OCR, the [`ItemMetadata.mimeType`](/workspace/cloud-search/docs/reference/rest/v1/indexing.datasources.items#ItemMetadata) for the item must be specified as `application/pdf` and a PDF file must contain only scanned images. If the PDF file contains any native text content, Cloud Search indexes the native content and does not apply OCR to images.\n\nOCR also works on files with these characteristics:\n\n- Hand-written documents. Documents in Latin script, Japanese, and Korean yield the best results.\n- Vertically-written documents, such as those in Japanese.\n- Right-to-left-written documents, such as Hebrew."]]