Tìm văn bản trên một hình ảnh [đóng]


-1

Tôi muốn có thể tìm thấy văn bản trên hình ảnh tuyệt vời sau đây và nơi văn bản được đặt trong đó. Đây không phải là lần đầu tiên tôi vấp phải một thử thách như vậy và có lẽ nhiều người cũng có câu hỏi tương tự. Tôi nghĩ rằng đây là một ví dụ tốt về vấn đề chung.

Có nhiều cách ( 1 , 2 , 3 , 4 ...) để đạt được điều này theo cách tùy chỉnh nhưng liệu có bất kỳ OCR nào ngoài đó có thể tự động chuyển đổi nó thành PDF văn bản không? Hoặc bất kỳ định dạng khác cho phương tiện đó. Tôi đang trích dẫn PDF chỉ vì nó là định dạng được thực hiện để xử lý chính xác loại công cụ này.

Có vẻ như Cuneiform sẽ là một công cụ hoàn hảo để thực hiện thủ công, nhưng tôi không thể biên dịch nó trên mac và tôi không bận tâm làm điều đó trong trường hợp này, nhưng tôi cá rằng một số thực tập viên không ngừng có thể sử dụng nó để bổ sung cho OCR. không bao giờ có thể xác định những hình ảnh trong đó.

Đây là một mẫu hình ảnh thu nhỏ để chúng ta có thể hình dung rõ hơn mức độ liên quan của câu hỏi:

hình ảnh tuyệt vời


3
Ok, nghiêm túc, bạn không cần phải đặt một hình ảnh lớn trong bài viết của mình khi nó không liên quan gì đến câu hỏi.
Wuffers

3
@Mark nó có mọi thứ để làm với câu hỏi. Tôi muốn tìm văn bản trên hình ảnh đó . Nó hoàn toàn minh họa sự thôi thúc.
cregox

Nó không. Có thật không. Câu hỏi của bạn áp dụng cho bất kỳ hình ảnh. Câu hỏi sẽ được sử dụng cho người khác nếu nó chỉ áp dụng cho hình ảnh đó?
Wuffers

2
@Mark mà không có hình ảnh thì câu hỏi có thể không đủ rõ ràng. Tôi liên kết nó không phải để hiển thị hình ảnh, mà là để cung cấp nguồn. Bây giờ bạn biết chính xác những gì tôi muốn nói bởi vì bạn đã xem nó trước khi chỉnh sửa nó. Nhưng bạn sẽ hình dung câu hỏi sẽ là gì nếu bạn không nhìn vào nó? Tôi đặt cược bạn sẽ không nghĩ đó là điều đó phức tạp.
cregox

Câu trả lời:


1

Một số giải pháp gần như:

Google Docs sẽ OCR nhưng không chèn văn bản dưới dạng một lớp (Tôi chưa từng thử nó) http://googledocs.blogspot.com/2010/06/optical-character-recognition-oc-in.html

Abbyy Finereader ( http://www.abbyy.com/ ) sẽ biến nó thành PDF với văn bản cơ bản (tôi hiện đang sử dụng nó cho mục đích này), tuy nhiên nó có giá (bạn có thể lấy phiên bản dùng thử) và chỉ dành cho Windows

Evernote có thể OCR trong hình ảnh tuy nhiên tôi không biết liệu nó có xuất ra PDF với văn bản cơ bản không

Bạn có thể tải xuống phiên bản dùng thử của Acrobat Pro và sử dụng Tài liệu> Nhận dạng văn bản OCR> Nhận dạng văn bản bằng OCR. Tôi có Acrobat Pro tại nơi làm việc, nhưng chưa bao giờ sử dụng chức năng OCR vì vậy không biết nó tốt như thế nào. Một lần nữa, chỉ Windows (nhưng bạn cũng có thể có Windows trên VM / Parallels / Virtualbox / Bootcamp)


Tôi đã thử tài liệu google. Nó chủ yếu là xấu về hình ảnh đó. Hãy thử nó! Evernote mất một thời gian để OCR lên, nhưng nó thật tuyệt vời. Quá tệ không có PDF (hoặc cách tốt để xem nó bằng mọi cách). Tôi chỉ có thể sử dụng nó trong chính chương trình và thật tuyệt vời là tôi không thể tìm thấy bất kỳ cách nào để "phóng to". Và, kỳ lạ như nó có thể nghe, không có thử nghiệm acrobat cho mac - nhưng tôi sẽ sớm cho nó một shot.
cregox

Cho đến nay Evernote là giải pháp duy nhất. Nếu bất cứ ai quan tâm, tôi cũng đã nhận được kịch bản tuyệt đẹp này , nhưng tôi không thể làm cho nó hoạt động được vì tôi không có quyền truy cập root tại máy làm việc này.
cregox

1

Hình ảnh bạn liên kết có độ phân giải thấp đến mức hầu hết các phần mềm OCR sẽ gặp khó khăn với nó và bạn có thể sẽ gặp phải một giải pháp khá tệ. Thành thật mà nói, nếu bạn bắt đầu sao chép nó ngay bây giờ, có lẽ bạn sẽ tiết kiệm thời gian hơn trong việc tìm kiếm một vài gói, thử chúng, cố gắng làm cho chúng hoạt động và cuối cùng phải sửa mọi mục khác do đọc sai.


Adam, đọc các bình luận về câu hỏi. Có hai liên kết với cùng một hình ảnh ở độ phân giải cao. Trừ khi bạn có nghĩa là ngay cả điều đó có độ phân giải thấp - mà tôi sẽ đồng ý với một điểm. Và tôi không quan tâm tất cả những điều đó nếu điều này không bao giờ được thực hiện. Tôi có lẽ sẽ không bao giờ bận tâm để sao chép nó. Ít nhất không phải lúc này, không phải với một hình ảnh này ...;)
cregox

1
@Cawas - Hình ảnh "độ phân giải cao" được liên kết không đủ độ phân giải cao. Tuy nhiên, bạn có nguồn cho bản gốc (ở góc dưới bên trái) bạn đã xem xét liên hệ với họ và yêu cầu tệp thiết kế ban đầu, có khả năng bao gồm văn bản không?
Adam Davis

Adam, không thực sự. Nguồn cũng nằm trên liên kết đầu tiên. Nhưng, một lần nữa, không thể quan tâm đến nó nhiều như vậy. Quan điểm của tôi ở đây là thách thức OCR!
cregox
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.