Chia hình ảnh của văn bản thành các từ - có thể?


0

Tôi tự hỏi liệu có cách nào để phân chia một bản sao được quét của một trang (tức là một hình ảnh) thành hình ảnh của các từ cấu thành của nó. Cuốn sách đang được quét bằng ngôn ngữ Ấn Độ mà OCR (Nhận dạng ký tự quang học) sẽ không hoạt động.

Mục tiêu là có một phiên bản kỹ thuật số của cuốn sách (cùng ngôn ngữ) và vì thế, tôi đã nghĩ đến việc làm như sau -

  • quét sách
  • chia nội dung của một trang thành các từ cấu thành của nó
  • gửi hình ảnh của các từ để phiên âm những người có thể gõ từ trong hình ảnh
  • tập hợp lại các từ trong mỗi trang

Vì hình ảnh phù hợp với hình ảnh là hợp lý tốt, hình ảnh của cùng một từ có thể được xác định, và do đó sẽ không phải được sao chép lại nhiều lần.

Bất kỳ sự trợ giúp nào đều sẽ là tuyệt vời!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.