Sử dụng OCR trên văn bản tiếng Ả Rập


3

Một người bạn đã yêu cầu tôi chuyển đổi một văn bản tiếng Ả Rập .pdf thành Word. Google Docs dường như không phải là một lựa chọn nhưng OCR mới trông có vẻ đầy hứa hẹn vì tiếng Ả Rập được đặc trưng trong danh sách 'Ngôn ngữ nhận dạng'. Tôi đã không làm cho nó hoạt động ngoài "Lỗi! Không thể nhận ra văn bản." thậm chí chỉ với một vài trang mẫu (111KB).

Tôi đánh giá cao bất kỳ lời khuyên nào về những gì tôi đang làm sai tại trang web đó (hoặc thậm chí cách truy cập bất kỳ trợ giúp nào có sẵn ở đó!) Hoặc chỉ vào các tùy chọn (miễn phí!) Khác hoạt động với văn bản tiếng Ả Rập (tốt nhất là không yêu cầu đăng ký và hoặc tải lớn). Bất cứ ai sẵn sàng giúp đỡ xin vui lòng?

Lưu ý .pdf này không có lớp văn bản.

Câu trả lời:


1

Vì câu hỏi không phải là yêu cầu đề xuất chương trình tốt nhất (có lẽ sẽ lạc đề ở đây) mà là về việc OCR mới hoạt động theo cách nó được cho là hoặc cho bất kỳ trình chuyển đổi miễn phí nào khác hoạt động cho văn bản tiếng Ả Rập Tôi nghĩ thật công bằng khi nói rằng Chuyển đổi OCR là một câu trả lời. Đây là trực tuyến, miễn phí và không cần đăng ký.

Nó không quản lý tất cả 67 trang cùng một lúc (sau khoảng 15 phút chương trình báo lỗi) nhưng nó đã chuyển đổi 10 trang cùng một lúc. Chất lượng / độ chính xác là đáng ngờ (dựa trên bản dịch với Google) nhưng tôi rất vui khi coi đó là một vấn đề riêng biệt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.