Để làm cho văn bản .jpeg
có thể chỉnh sửa, bạn cần phần mềm Nhận dạng ký tự quang học (OCR). Tôi sử dụng ocrfeeder
.
sudo apt-get install ocrfeeder
Để mở tệp hình ảnh, nhấp vào dấu 'cộng' (+).
Sau khi bạn đã mở hình ảnh, nhấp vào biểu tượng tiếp theo bên phải để chạy OCR.
Sau khi hoàn thành OCR'ing hình ảnh, bạn có thể chọn văn bản bạn muốn ở bên trái và sao chép nó ra bên phải.
Cách dễ nhất để lấy văn bản ra là chỉ cần sao chép nó sang LibreOffice. Với một chút chỉnh sửa, bản sao của tôi trông rất giống nhau.
Sau khi bạn thực hiện các thay đổi bắt buộc, bạn có thể xuất chúng .pdf
bằng cách nhấp vào 'xuất dưới dạng pdf' từ toobar LibreScript.
Cuối cùng, tốt nhất để quét .pdf
nếu bạn có thể. Nếu bạn không thể làm việc này rất tốt.
LƯU Ý: OCR không chính xác 100%, bạn có thể phải sửa lỗi và tài liệu của bạn càng có nhiều định dạng thì càng khó.