Đây là phần bổ sung cho câu trả lời của @Dennis ngày 18:06 ngày 30 tháng 7 năm 2012. Anh ấy chắc chắn giải quyết trường hợp khó hơn.
Trong trường hợp đơn giản nhất, ví dụ hình mờ là văn bản đơn giản, không có văn bản
Smedley cho ủy viên
hình mờ PDF không nén có thể được định nghĩa như thế này:
BT
75.96 625 Td
(Smedley For Commissioner)Tj
ET
trong đó 75.96
là bù ngang và 625
bù dọc cho trường hợp hình mờ cụ thể này. (Có, có thể nhìn thấy cả số thực và số nguyên.)
Một biểu thức chính quy như sau sẽ hoạt động cho tất cả các hình mờ như vậy, bỏ qua mọi biến thể trong vị trí của chúng:
^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n
Xin lưu ý rằng, một loạt các toán tử sửa đổi PDF có thể hoạt động với các hình mờ có định dạng phức tạp hơn. Sự huyền ảo như vậy có thể biến những gì người đọc mong đợi (hy vọng?) Trở thành một chuỗi liên tục, dễ tìm kiếm thành một mớ hỗn độn của bảng chữ cái. Ví dụ,
E 1 = mc² bởi Smedley ™
Có thể là sản phẩm của điều này:
BT
75.96 625 Td
(E)Tj
-5 Ts
(1)Tj
0 Ts
( = mc)Tj
5 Ts
(2)Tj
0 Ts
(by Smedley)Tj
5 Ts
(TM)Tj
0 Ts
ET
. . . hoặc tệ hơn nhiều nếu watermark của bạn được tăng cường màu sắc!
Đã lưu ý tất cả những điều này, tôi cũng sẽ lưu ý rằng PDFtk có phiên bản GUI có thể xử lý các hình mờ, xem xét về phí cấp phép 4 đô la. Không đắt chút nào!
Mặt khác, tôi thấy trang web của nó hiện đang quảng cáo hỗ trợ đầy đủ cho O / S thông qua Windows 8
và OS X 10.8 Mountain Lion
. Đó là cổ điển hơn 4 năm trước. PDFtk có thể bị lỗi thời? Tôi nghi ngờ là không, nhưng tôi không biết.