Có thư viện OCR miễn phí nào cho Android không? [đóng cửa]


148

Tôi đang tìm kiếm một OCR Java chạy trên Android, tuy nhiên Asprise dường như không phải là một OCR độc lập trên nền tảng. Có bất kỳ Java OCR mã nguồn mở / miễn phí nào tôi có thể sử dụng để phát triển ứng dụng Android không?


9
Câu hỏi này nên được mở lại, Đây là một câu hỏi rất quan trọng và hợp lệ
Utsav Gupta

5
Google gần đây đã phát hành API OCR: developers.google.com/vision/text-overview
Wirling

Câu trả lời:


38

OCR có thể khá tốn CPU, bạn có thể muốn xem xét lại việc thực hiện trên điện thoại thông minh.

Ngoài ra, theo hiểu biết của tôi, các thư viện OCR phổ biến là AspireTesseract . Cả Java đều không hoạt động, vì vậy bạn sẽ không nhận được thư viện Android OCR thả xuống.

Tuy nhiên, Tesseract là mã nguồn mở (GitHub được lưu trữ nguyên vẹn); vì vậy bạn có thể dành chút thời gian để chuyển tập hợp con bạn cần sang Java. Sự hiểu biết của tôi là C ++ không điên rồ , vì vậy tùy thuộc vào mức độ bạn cần OCR, nó có thể đáng giá như thế nào.

Câu trả lời ngắn gọn: Không.

Câu trả lời dài: nếu bạn sẵn sàng làm việc cho nó.


2
bằng cách chuyển nó qua, bạn có nghĩa là viết lại tập hợp con trong Java? điều đó có thể mất rất nhiều nỗ lực, vì vậy không có 100% Java OCR ngoài kia?
dùng121196

13
Tôi khuyên bạn nên thử bọc Tesseract trong lớp JNI thông qua Android NDK, thay vì cố gắng chuyển nó sang Java của Android. Tesseract dường như đã được chuyển sang ARM, do đó việc đặt API JNI lên trên nó sẽ dễ dàng hơn. Ngoài ra, điều này giữ cho nó nhanh (er) hơn bất kỳ cổng Java nào và sẽ đơn giản hóa việc bảo trì dài hạn.
CommonsWare

15
Hiện đã có giao diện Tesseract JNI cho Java có tên là Tessjeract. code.google.com/p/tesjeract
sventechie

1
Tesseract sẽ không đi bộ ngắn từ C đến java. Mã tôi đã thấy là 80 'C rất thành ngữ và không dễ dàng chuyển sang các ngôn ngữ khác.
plinth

2
@vincent biến mất vào năm ngoái. Phiên bản JNA hiện đã có: github.com/nguyenq/tess4j nhưng cũng là một ngã ba Android: github.com/rmtheis/tess-two
sventechie

21

Tôi gặp khá nhiều may mắn với tesseract-android-tools


Câu hỏi đã được đóng lại, nhưng thật tốt khi tìm thấy một người có kết quả tích cực. Rất khó để tìm thấy những người trong các dự án loại sourceforge này. Câu hỏi: bạn đã thử Tesseract với quét hình ảnh hộ chiếu hoặc tài liệu ID chưa? Nó có vẻ ổn với các tệp PDF văn bản nhưng tôi đang vật lộn với hình ảnh.
PKHunter

Tôi đã không thử nó với bất cứ thứ gì có hình ảnh, nó chỉ là một tài liệu có văn bản (cùng phông chữ, kiểu chữ, kích thước)
Ben Pearson

Tôi hy vọng nó hoạt động với tôi
Electron lãng mạn

20

Tùy chọn khác có thể là đăng ảnh lên webapp (có thể vào lúc sau) và xử lý OCR ở đó mà không gặp sự cố cổng C ++ -> Java và có thể làm tắc nghẽn CPU di động.


ý tưởng rất hay: DI giả sử bạn có nghĩa là một dịch vụ web (asmx) cảm ơn
Omidoo


4

Có, có.

Nhưng OCR rất rộng lớn. Tôi biết một ứng dụng Android có tính năng OCR, nhưng đó có thể không phải là loại OCR bạn đang chăm sóc.

Ứng dụng mã nguồn mở này được gọi là Aedict và nó thực hiện OCR trên các ký tự tiếng Nhật viết tay. Nó không phải là chậm.

Nếu đó không phải là những gì bạn đang tìm kiếm, vui lòng chính xác loại ký tự nào và dữ liệu đầu vào nào (hình ảnh hoặc lịch sử cảm ứng XY).


2

Bạn có thể sử dụng trình đọc OCR tài liệu google .


Đã đăng câu trả lời này lên một câu hỏi khác được đánh dấu là một bản sao của câu hỏi này vì vậy tôi nghĩ rằng tôi cũng có thể đăng nó ở đây
richardwiden

1
Không liên kết đến tài liệu
Volodymyr
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.