0
Làm cách nào để nén các tệp PDF được mã hóa Tesseract trong khi duy trì văn bản nhúng từ OCR?
Tôi đã thử nghiệm sử dụng Tesseract để OCR các tệp PDF của tôi và nó hầu như thành công, đặc biệt là với các văn bản Fraktur của Đức (bản in gothic kiểu cũ), những công cụ như Adobe Acrobat không thể nhận ra đúng. Vấn đề là các …