পাঠ্য স্বীকৃতি

ML Kit Text Recognition API যেকোনো ল্যাটিন-ভিত্তিক অক্ষর সেটে পাঠ্যকে চিনতে পারে। এটি ক্রেডিট কার্ড, রসিদ এবং ব্যবসায়িক কার্ড প্রক্রিয়াকরণের মতো ডেটা-এন্ট্রি কাজগুলিকে স্বয়ংক্রিয় করতেও ব্যবহার করা যেতে পারে।

আইওএস অ্যান্ড্রয়েড

মূল ক্ষমতা

  • ল্যাটিন-ভিত্তিক ভাষা জুড়ে পাঠ্য সনাক্ত করুন ল্যাটিন স্ক্রিপ্ট ব্যবহার করে পাঠ্য সনাক্তকরণ সমর্থন করে
  • টেক্সট গঠন বিশ্লেষণ শব্দ/উপাদান, লাইন এবং অনুচ্ছেদ সনাক্তকরণ সমর্থন করে
  • পাঠ্যের ভাষা সনাক্ত করুন স্বীকৃত পাঠ্যের ভাষা সনাক্ত করে
  • ছোট অ্যাপ্লিকেশন ফুটপ্রিন্ট অ্যান্ড্রয়েডে, API Google Play পরিষেবার মাধ্যমে একটি আনবান্ডেড লাইব্রেরি হিসাবে দেওয়া হয়
  • রিয়েল-টাইম স্বীকৃতি বিভিন্ন ডিভাইসে রিয়েল-টাইমে পাঠ্যকে চিনতে পারে

পাঠ্য কাঠামো

পাঠ্য শনাক্তকারী পাঠ্যকে ব্লক, লাইন, উপাদান এবং প্রতীকে ভাগ করে। কঠোরভাবে কথা বলা:

  • একটি ব্লক হল পাঠ্য লাইনের একটি সংলগ্ন সেট, যেমন একটি অনুচ্ছেদ বা কলাম,

  • একটি রেখা হল একই অক্ষে শব্দের একটি সংলগ্ন সেট, এবং

  • একটি উপাদান হল বেশিরভাগ ল্যাটিন ভাষায় একই অক্ষের আলফানিউমেরিক অক্ষরের ("শব্দ") একটি সংলগ্ন সেট, বা অন্যদের একটি শব্দ

  • একটি প্রতীক হল বেশিরভাগ ল্যাটিন ভাষায় একই অক্ষের একটি একক বর্ণসংখ্যার অক্ষর বা অন্যদের একটি অক্ষর

নীচের চিত্রটি নিচের ক্রমে এইগুলির প্রতিটির উদাহরণ হাইলাইট করে৷ প্রথম হাইলাইট করা ব্লক, সায়ানে, পাঠ্যের একটি ব্লক। হাইলাইট করা ব্লকের দ্বিতীয় সেট, নীল রঙে, পাঠ্যের লাইন। অবশেষে, গাঢ় নীল রঙে হাইলাইট করা ব্লকের তৃতীয় সেট হল শব্দ।

সমস্ত সনাক্ত করা ব্লক, লাইন, উপাদান এবং প্রতীকগুলির জন্য, API বাউন্ডিং বাক্স, কোণার পয়েন্ট, ঘূর্ণন তথ্য, আত্মবিশ্বাসের স্কোর, স্বীকৃত ভাষা এবং স্বীকৃত পাঠ্য প্রদান করে।

উদাহরণ ফলাফল


ছবি: ডায়েটমার রাবিচ , উইকিমিডিয়া কমন্স , "ডুসেলডর্ফ, ওয়েজ ডার পার্লামেন্টারিসচেন ডেমোক্র্যাটি -- 2015 -- 8123" , CC BY-SA 4.0
স্বীকৃত পাঠ্য
পাঠ্য ওয়েজ
der parlamentarischen
গণতন্ত্র
ব্লক (1 ব্লক)
ব্লক 0
পাঠ্য Wege der parlamentarischen Demokratie
ফ্রেম (২৯৬, ৬৬৫ - ৭৯৬, ৮৮২)
কোণার পয়েন্ট (296, 719), (778, 665), (796, 828), (314, 882)
স্বীকৃত ভাষা কোড ডি
লাইন (৩ লাইন)
লাইন 0
পাঠ্য Wege der
ফ্রেম (৪৩৪, ৬৭৮ - ৬৭০, ৭৪৯)
কোণার পয়েন্ট (434, 705), (665, 678), (670, 722), (439, 749)
স্বীকৃত ভাষা কোড ডি
আত্মবিশ্বাসের স্কোর ০.৮৭৬৬৭৪১
ঘূর্ণন ডিগ্রী -6.6116457
উপাদান (2 উপাদান)
উপাদান 0
পাঠ্য ওয়েজ
ফ্রেম (434, 689 - 575, 749)
কোণার পয়েন্ট (434, 705), (570, 689), (575, 733), (439, 749)
স্বীকৃত ভাষা কোড ডি
আত্মবিশ্বাসের স্কোর 0.8964844
ঘূর্ণন ডিগ্রী -6.6116457
উপাদান (4 উপাদান)
চিহ্ন 0
পাঠ্য ডব্লিউ
ফ্রেম (৪৩৪, ৬৯৮ - ৫০০, ৭৪৯)
কোণার পয়েন্ট (434, 706), (495, 698), (500, 741), (439, 749)
আত্মবিশ্বাসের স্কোর 0.87109375
ঘূর্ণন ডিগ্রী -6.611646