পাঠ্য নিষ্কাশনের জন্য সমর্থিত ফাইল প্রকার

ক্লাউড সার্চ ফাইলের ধরন (MIME বা বিষয়বস্তুর প্রকার) নির্বিশেষে পাঠানো সমস্ত আইটেমকে সূচী করে। সূচীকরণ একটি ফাইলের মেটাডেটা ডেটা এবং সমর্থিত হলে, এর বিষয়বস্তুর উপর সঞ্চালিত হয়। নিম্নলিখিত ফাইল প্রকারের একটি তালিকা রয়েছে যার জন্য সামগ্রী সূচীকরণ সমর্থিত

  • মাইক্রোসফট ওয়ার্ড (DOC)
  • মাইক্রোসফট ওয়ার্ড (DOCX)
  • মাইক্রোসফট এক্সেল (এক্সএলএস)
  • মাইক্রোসফট এক্সেল (XLSX)
  • মাইক্রোসফট পাওয়ারপয়েন্ট (PPT)
  • মাইক্রোসফট পাওয়ারপয়েন্ট (PPTX)
  • Adobe এর পোর্টেবল ডকুমেন্ট ফরম্যাট (PDF)
  • রিচ টেক্সট ফরম্যাট (RTF)
  • পাঠ্য বিন্যাস (TXT)
  • হাইপারটেক্সট মার্কআপ ল্যাঙ্গুয়েজ (HTML)
  • এক্সটেনসিবল মার্কআপ ল্যাঙ্গুয়েজ (XML)

এই ধরনের ফাইলগুলি ছাড়াও, ক্লাউড অনুসন্ধান যেকোনো প্লেইন টেক্সট ফাইলের মধ্যে সামগ্রীর সূচীকরণ সমর্থন করে।

অপটিক্যাল ক্যারেক্টার রিকগনিশন (OCR) ফাইলের ধরন এবং বৈশিষ্ট্য

Google ক্লাউড সার্চও নিম্নলিখিত ফাইল প্রকারগুলি থেকে পাঠ্য বের করতে OCR ব্যবহার করে:

ফাইলের ধরন সর্বাধিক আকার
জয়েন্ট ফটোগ্রাফিক এক্সপার্ট গ্রুপ (JPG) 10 এমবি
গ্রাফিক ইন্টারচেঞ্জ ফরম্যাট (GIF) 10 এমবি
ট্যাগ করা ছবি ফাইল ফরম্যাট (TIFF) 10 এমবি
স্কেলেবল ভেক্টর গ্রাফিক্স (SVG) 10 এমবি
পোস্টস্ক্রিপ্ট ইমেজ ফরম্যাট (PS) 10 এমবি
পোর্টেবল ডকুমেন্ট ফরম্যাট (পিডিএফ) 30 এমবি

ওসিআর এই বৈশিষ্ট্যগুলির সাথে ফাইলগুলিতেও কাজ করে:

  • হাতে লেখা নথি। ল্যাটিন লিপি, জাপানি এবং কোরিয়ান ভাষায় নথিগুলি সেরা ফলাফল দেয়৷
  • উল্লম্বভাবে-লিখিত নথি, যেমন জাপানি ভাষায়।
  • ডান-থেকে-বামে-লিখিত নথি, যেমন হিব্রু।