Tôi muốn có thể tìm thấy văn bản trên hình ảnh tuyệt vời sau đây và nơi văn bản được đặt trong đó. Đây không phải là lần đầu tiên tôi vấp phải một thử thách như vậy và có lẽ nhiều người cũng có câu hỏi tương tự. Tôi nghĩ rằng đây là một ví dụ tốt về vấn đề chung.
Có nhiều cách ( 1 , 2 , 3 , 4 ...) để đạt được điều này theo cách tùy chỉnh nhưng liệu có bất kỳ OCR nào ngoài đó có thể tự động chuyển đổi nó thành PDF văn bản không? Hoặc bất kỳ định dạng khác cho phương tiện đó. Tôi đang trích dẫn PDF chỉ vì nó là định dạng được thực hiện để xử lý chính xác loại công cụ này.
Có vẻ như Cuneiform sẽ là một công cụ hoàn hảo để thực hiện thủ công, nhưng tôi không thể biên dịch nó trên mac và tôi không bận tâm làm điều đó trong trường hợp này, nhưng tôi cá rằng một số thực tập viên không ngừng có thể sử dụng nó để bổ sung cho OCR. không bao giờ có thể xác định những hình ảnh trong đó.
Đây là một mẫu hình ảnh thu nhỏ để chúng ta có thể hình dung rõ hơn mức độ liên quan của câu hỏi: