ক্লাউড সার্চ ফাইলের ধরণ (MIME বা কন্টেন্ট-টাইপ) নির্বিশেষে প্রেরিত সকল আইটেমকে সূচীবদ্ধ করে। সূচীকরণ একটি ফাইলের মেটাডেটা ডেটা এবং যদি সমর্থিত হয়, তাহলে এর সামগ্রীর উপর সঞ্চালিত হয়। নিম্নলিখিত ফাইলের ধরণের একটি তালিকা রয়েছে যার জন্য কন্টেন্ট সূচীকরণ সমর্থিত ।
- মাইক্রোসফট ওয়ার্ড (DOC)
- মাইক্রোসফট ওয়ার্ড (DOCX)
- মাইক্রোসফট এক্সেল (এক্সএলএস)
- মাইক্রোসফট এক্সেল (XLSX)
- মাইক্রোসফট পাওয়ারপয়েন্ট (পিপিটি)
- মাইক্রোসফট পাওয়ারপয়েন্ট (পিপিটিএক্স)
- অ্যাডোবির পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ)
- রিচ টেক্সট ফরম্যাট (RTF)
- টেক্সট ফরম্যাট (TXT)
- হাইপারটেক্সট মার্কআপ ল্যাঙ্গুয়েজ (HTML)
- এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ (XML)
এই ধরণের ফাইল ছাড়াও, ক্লাউড সার্চ যেকোনো প্লেইন টেক্সট ফাইলের মধ্যে কন্টেন্টের ইনডেক্সিং সমর্থন করে।
অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ফাইলের ধরণ এবং বৈশিষ্ট্য
গুগল ক্লাউড সার্চ নিম্নলিখিত ফাইল প্রকারগুলি থেকে টেক্সট বের করার জন্য OCR ব্যবহার করে:
| ফাইলের ধরণ | সর্বোচ্চ আকার |
|---|---|
| জয়েন্ট ফটোগ্রাফিক এক্সপার্টস গ্রুপ (জেপিজি) | ১০ মেগাবাইট |
| গ্রাফিক ইন্টারচেঞ্জ ফরম্যাট (GIF) | ১০ মেগাবাইট |
| ট্যাগ করা চিত্র ফাইল ফর্ম্যাট (TIFF) | ১০ মেগাবাইট |
| স্কেলেবল ভেক্টর গ্রাফিক্স (SVG) | ১০ মেগাবাইট |
| পোস্টস্ক্রিপ্ট ইমেজ ফরম্যাট (পিএস) | ১০ মেগাবাইট |
| পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) | ৩০ মেগাবাইট |
OCR এই বৈশিষ্ট্যযুক্ত ফাইলগুলিতেও কাজ করে:
- হাতে লেখা নথি। ল্যাটিন, জাপানি এবং কোরিয়ান লিপিতে লেখা নথিগুলি সবচেয়ে ভালো ফলাফল দেয়।
- উল্লম্বভাবে লিখিত নথি, যেমন জাপানি ভাষায়।
- ডান থেকে বামে লেখা নথি, যেমন হিব্রু।