OCR miễn phí tốt với GUI để sửa lỗi? (cho cửa sổ)


9

Tôi đã sử dụng SimpleOCR , có GUI đẹp để sửa lỗi. Thật không may, nó làm cho rất nhiều sai lầm! (và bị các lỗi và hạn chế khác)

Mặt khác, Tesseract chính xác hơn nhưng không có GUI nào cả.

Câu hỏi của tôi là, có một chương trình OCR miễn phí cho Windows có GUI đẹp tỷ lệ lỗi thấp không? Tôi muốn nó làm nổi bật các từ nghi ngờ (bởi độ không chắc chắn của OCR, không chỉ kiểm tra chính tả) và hiển thị từ gốc (bitmap) trong khi tôi đang chỉnh sửa từ OCRed tương tự như SimpleOCR làm.

Nguồn mở sẽ là tốt nhất, tiếp theo là phần mềm miễn phí, sau đó dùng thử / demo / crippleware một chặng đường dài phía sau.

Ảnh chụp màn hình SimpleOCR hiển thị GUI để sửa lỗi


bản sao có thể có của phần mềm OCR miễn phí
Sathyajith Bhat

2
@Sathya: yêu cầu cụ thể của tôi phân biệt nó với câu hỏi đó.
Hugh Allen

Không chính xác miễn phí, nhưng bạn đã xem xét Microsoft Office chưa? Nó đi kèm với OCR. (Tìm tính năng "Chụp ảnh tài liệu Microsoft Office" trong thiết lập.)
V Xoayin

@ Tác giảrowner: Tôi vừa thử nó. Độ chính xác của nó tương đương với Tesseract nhưng nó yêu cầu tệp TIFF với cài đặt DPI phù hợp hoặc nó không hoạt động và nó không có giao diện để sửa lỗi OCR.
Hugh Allen

@Hugh Allen: Phải không? Nó hoạt động khá tốt khi tôi tình cờ thấy chức năng menu ngữ cảnh trong OneNote 2007. Và tôi đang sử dụng một tệp hình ảnh ngẫu nhiên được sao chép từ một trang web ...
V Xoayin

Câu trả lời:


2

Bạn đã thử gimagereader , một mặt trận gui cho Tesseract chưa?


Tôi mới dùng thử (trong Windows) và nó không chạy cho tôi - quá trình thoát ngay lập tức mà không có thông báo lỗi :( Dù sao, nhìn vào ảnh chụp màn hình, nó dường như không thực sự làm nổi bật từ bạn đang chỉnh sửa. nó?
Hugh Allen

2

OCRopus :

Phần mềm này một phần dựa trên Tesseract, công cụ OCR mã nguồn mở tốt nhất hiện có. Mặc dù dự án dự kiến ​​sẽ được phát hành vào cuối năm tới và sẽ được sử dụng cho dự án quét sách của Google, nhóm này có một số ứng dụng thú vị:

  • giao diện dịch vụ web
  • PDF, máy ảnh và màn hình OCR
  • tích hợp với các công cụ tìm kiếm trên máy tính để bàn: Beagle, Spotlight, Google Desktop

OCRopus (tm) là một hệ thống phân tích tài liệu và hệ thống OCR tiên tiến, bao gồm phân tích bố cục có thể cắm, nhận dạng ký tự có thể cắm, mô hình ngôn ngữ tự nhiên thống kê và khả năng đa ngôn ngữ.

Công cụ OCRopus dựa trên hai dự án nghiên cứu: bộ nhận dạng chữ viết hiệu suất cao được phát triển vào giữa những năm 90 và được triển khai bởi Cục điều tra dân số Hoa Kỳ và các phương pháp phân tích bố cục hiệu suất cao mới lạ.

OCRopus là sự phát triển được tài trợ bởi Google và ban đầu được dành cho các nỗ lực chuyển đổi tài liệu với khối lượng lớn, thông lượng cao. Chúng tôi hy vọng rằng nó cũng sẽ là một hệ thống OCR tuyệt vời cho nhiều ứng dụng khác. văn bản thay thế Liên kết:


GOCR

GOCR là chương trình OCR (Nhận dạng ký tự quang học), được phát triển theo Giấy phép Công cộng GNU. Nó chuyển đổi hình ảnh được quét của văn bản trở lại tập tin văn bản. Joerg Schulenburg bắt đầu chương trình, và bây giờ dẫn đầu một nhóm các nhà phát triển. GOCR có thể được sử dụng với các giao diện người dùng khác nhau, điều này giúp cho việc chuyển sang các hệ điều hành và kiến ​​trúc khác nhau rất dễ dàng. Nó có thể mở nhiều định dạng hình ảnh khác nhau và chất lượng của nó đã được cải thiện hàng ngày. văn bản thay thế văn bản thay thế

Liên kết:



Có ai trong số họ có một GUI tốt để đi với họ không?
Hugh Allen

1
Đã chỉnh sửa để trả lời câu hỏi của bạn .... nhưng tôi sẽ nói: "Không, họ không", nhưng tôi nghe thấy abiword hỗ trợ OCRopus ( arstechnica.com/open-source/news 2007/08/50 )
Krazy_Kaos

1
+1 để thêm ảnh chụp màn hình để trả lời và cũng để đánh giá nhỏ hai chương trình được cung cấp ...
Kurt Pfeifle

0

Ngoài ra còn có TOPOCR (còn gọi là SnapReader), chứa Trình kiểm tra chính tả sau xử lý cho 11 ngôn ngữ:

SnapReader có thể được sử dụng để tạo ghi chú có thể tìm kiếm của riêng bạn từ hầu hết mọi hình ảnh tài liệu. Hoặc bạn có thể sử dụng nó như một công cụ tác giả và tạo nội dung có thể chỉnh sửa của riêng bạn bằng máy quét hoặc máy ảnh của bạn và lưu kết quả dưới dạng HTML hoặc PDF. SnapReader cũng có thể chuyển đổi văn bản thành âm thanh chất lượng rất cao bằng Audrey. Vì vậy, bạn không chỉ có thể sử dụng máy quét hoặc máy ảnh để chụp tài liệu, giờ đây bạn còn có thể sử dụng trình phát nhạc di động hoặc điện thoại thông minh để "đọc" chúng.

hình ảnh

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.