Tôi đã thấy một số sách điện tử / giấy tờ rõ ràng được quét từ các phiên bản giấy của họ nhưng văn bản trong sách điện tử / giấy tờ có thể được sao chép một cách đáng kinh ngạc. Tôi cho rằng các phiên bản được quét trực tiếp phải được xử lý bởi một số phần mềm Nhận dạng ký tự quang học.
Vì vậy, tôi muốn biết các phần mềm nhận dạng ký tự quang học được đề xuất là gì? Đặc biệt là những thứ dành cho Ubuntu hoặc miễn phí? Nếu những cái đó cho Windows vượt trội hơn nhiều, xin vui lòng cho tôi biết.
Tôi đặc biệt quan tâm đến những OCR có thể chấp nhận tệp pdf được quét làm đầu vào và vẫn tạo ra một tệp pdf khác trông giống như đầu vào nhưng có thể sao chép văn bản.
Cảm ơn và trân trọng!
Vui lòng giới hạn một phần mềm cho mỗi câu trả lời