Tôi có một vài tệp PDF có chứa chữ ghép trong văn bản (ví dụ: ff
được kết hợp thành một ký tự duy nhất ff
).
Có cách nào dễ dàng để loại bỏ chúng khi sao chép văn bản từ PDF không? (tức là khi tôi dán, tôi muốn ff
dán vào ff
).
Tôi sao chép rất nhiều văn bản từ các tệp PDF này vào câu trả lời trên Stack Overflow và tôi thấy các chữ ghép ở mức đáng ghét nhất (ok, tôi thừa nhận, tôi thực sự rất kén chọn :-P); các chữ ghép cũng không hiển thị chính xác khi được sao chép vào các vị trí khác (ví dụ: nếu tôi sao chép chúng vào Notepad, chúng sẽ hiển thị dưới dạng các khối).
Tôi không thể sửa đổi các tệp PDF.
Tôi sử dụng cả Adobe Acrobat Reader và Foxit Reader, nhưng tôi sẵn sàng thử một trình đọc PDF mới.