Nhận dạng văn bản

API Nhận dạng văn bản của Bộ công cụ máy học có thể nhận dạng văn bản trong bất kỳ bộ ký tự nào dựa trên bộ La-tinh. Dữ liệu này cũng có thể được dùng để tự động hoá các tác vụ nhập dữ liệu như xử lý thẻ tín dụng, biên nhận và danh thiếp.

iOS Android

Các chức năng chính

  • Nhận dạng văn bản trên các ngôn ngữ dựa trên tiếng Latinh Hỗ trợ nhận dạng văn bản bằng chữ viết Latinh
  • Phân tích cấu trúc văn bản Hỗ trợ phát hiện các từ/phần tử, dòng và đoạn
  • Xác định ngôn ngữ của văn bản Xác định ngôn ngữ của văn bản được nhận dạng
  • Dấu vết ứng dụng nhỏ Trên Android, API được cung cấp dưới dạng một thư viện chưa nhóm thông qua Dịch vụ Google Play
  • Nhận dạng văn bản theo thời gian thực Có thể nhận dạng văn bản theo thời gian thực trên nhiều thiết bị

Cấu trúc văn bản

Trình nhận dạng văn bản phân đoạn văn bản thành các khối, các dòng, các phần tử và biểu tượng. Nói gần đây:

  • Khối là một tập hợp các dòng văn bản liền kề, chẳng hạn như một đoạn văn hoặc cột,

  • Dòng là một tập hợp các từ liền kề nhau trên cùng một trục, và

  • Phần tử là một tập hợp các ký tự chữ cái liền kề ("word") trên cùng một trục ở hầu hết các ngôn ngữ La tinh hoặc một từ trong những ngôn ngữ khác

  • Biểu tượng là một ký tự chữ-số duy nhất trên cùng một trục trong hầu hết các ngôn ngữ La tinh hoặc một ký tự ở các ngôn ngữ khác

Hình ảnh bên dưới sẽ làm nổi bật ví dụ về từng giải pháp theo thứ tự giảm dần. Khối được làm nổi bật đầu tiên, bằng màu xanh lơ, là một Khối văn bản. Bộ khối thứ hai được đánh dấu, màu xanh lam, là các dòng văn bản. Cuối cùng, tập hợp các khối được đánh dấu thứ ba, có màu xanh đậm, là Words.

Đối với tất cả các khối, dòng, phần tử và ký hiệu được phát hiện, API sẽ trả về hộp giới hạn, điểm góc, thông tin xoay, điểm tin cậy, ngôn ngữ được nhận dạng và văn bản được nhận dạng.

Kết quả mẫu


Ảnh: Dietmar Rabich, Wikimedia Commons, "Düsseldorf, Wege der parlamentarischen Demokratie – 2015 -- 8123", CC BY-SA 4.0
Văn bản được nhận dạng
Văn bản Wege
der parlamentarischen
demokratie
Chặn bóng (1 khối)
Chặn 0
Văn bản Vé Wege der parlamentarischen Demokratie
Khung (296, 665 - 796, 882)
Điểm góc (296, 719), (778, 665), (796, 828), (314, 882)
Mã ngôn ngữ được công nhận de
Dòng (3 dòng)
Dòng 0
Văn bản Wege der
Khung (434, 678 - 670, 749)
Điểm góc (434, 705), (665, 678), (670, 722), (439, 749)
Mã ngôn ngữ được công nhận de
Mức độ tin cậy 0,8766741
Độ xoay -6,6116457
Các phần tử (2 phần tử)
Phần tử 0
Văn bản Tiếng Wege
Khung (434, 689 – 575, 749)
Điểm góc (434, 705), (570, 689), (575, 733), (439, 749)
Mã ngôn ngữ được công nhận de
Mức độ tin cậy 0,8964844
Độ xoay -6,6116457
Các phần tử (4 phần tử)
Ký hiệu 0
Văn bản W
Khung (434, 698 - 500, 749)
Điểm góc (434, 706), (495, 698), (500, 741), (439, 749)
Mức độ tin cậy 0,87109375
Độ xoay -6,611646