Có bất kỳ chương trình OCR chữ viết tay nguồn mở tốt (tốt, miễn phí) nào không?


16

Tiêu đề yêu cầu tất cả. Tôi có trước một nhiệm vụ nhập dữ liệu mà tôi không quá hào hứng: 50-100 trang đăng nhập viết tay / đăng nhập nhật ký.

Các định dạng của các bản ghi có thể giúp đỡ. Các trang được phân vùng thành các hàng và cột được phân định rõ ràng (13r x 6c với một hàng tiêu đề được gõ thêm). Giúp tôi thêm nữa là ba cột có liên quan đến ngày / giờ (ngày, giờ hết, thời gian trong). Ngoài ra, dữ liệu trong hai trong số các cột (tài nguyên và tên) được liệt kê ít nhiều, do đó, ví dụ, tên "Smith" có thể xuất hiện nhiều lần trong cột tên, mỗi lần có cùng chữ viết tay. Cột cuối cùng, "Ghi chú", là hình thức miễn phí, nhưng nếu tôi có thể tự động hóa 6 cột trước đó, tôi sẽ không ngại nhập Ghi chú bằng tay.

Bất kỳ đề xuất? (Bên cạnh 'bắt đầu nhập'.)

Tái bút: Nếu có một trang SE tốt hơn để hỏi điều này, hãy cho tôi biết, tôi sẽ hỏi ở đó.


1
Bạn có thể gửi một bản quét mẫu của nhật ký?
Martin Thompson

1
Đừng bận tâm với Captricity - họ yêu cầu email của bạn và gửi ua "email liên kết" với một liên kết.

Và đây là điều xảy ra khi bạn nhầm lẫn với các thuật ngữ «nguồn mở» và «miễn phí» ... rằng bạn có một công ty đang cố gắng tận dụng lợi thế trên thị trường đưa ra ý tưởng rằng «nguồn mở» tương đương với «xấu ».
Joan

Câu trả lời:


6

tesseract là thư viện OCR tốt nhất và phổ biến nhất.

Nó đã được thử nghiệm với chữ viết tay và không quá tệ - mặc dù chữ viết tay không phải là một thứ dễ đọc. http://arxiv.org/ftp/arxiv/ con / 1003 / 1003.5893.pdf


Tesseract chắc chắn là lựa chọn tốt nếu bạn đang xem nguồn mở / miễn phí. Nó không phải là 100%, nhưng nó nhận được kết quả khá chính xác hầu hết thời gian.
Thuyền trưởng Kenpachi

4

Nếu bạn có dưới 10 trang, Captricity có thể làm điều đó miễn phí.

Ra khỏi hộp, không có giải pháp nguồn mở tốt nào cho những gì bạn đang tìm kiếm. Các giải pháp trả phí tốn rất nhiều giấy phép. Điều này dựa trên kinh nghiệm của chúng tôi khi xây dựng dịch vụ OCR chữ viết tay tại Captricity . Chúng tôi sử dụng tesseract trong sản xuất, nhưng chỉ như một cuộc bỏ phiếu kết hợp với trí thông minh của con người (dịch vụ cộng đồng) để mang lại chất lượng cao.

Mong rằng sẽ giúp!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.