Làm cách nào để xóa watermark khỏi pdf bằng pdftk?


33

Tôi cần xóa một số hình mờ email ngu ngốc mở rộng trên tất cả các trang của một cuốn sách thuộc phạm vi công cộng. Tôi đã xem trang người đàn ông pdftk và một số ví dụ nhưng vẫn không thể tìm ra cách loại bỏ các hình mờ. Tôi đánh giá cao gợi ý của bạn.

Câu trả lời:


35

nhiệm vụ rất đơn giản để thực hiện:

sử dụng sed:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf

nhưng, sau đó, hãy chắc chắn để sửa chữa kết quả đầu ra pdf

pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

tất cả thành một lệnh:

 sed -e "s/watermarktextstring/ /g" <input.pdf >unwatermarked.pdf && pdftk unwatermarked.pdf output fixed.pdf && mv fixed.pdf unwatermarked.pdf

hình mờ văn bản không có gì khác ngoài một văn bản giữa hai thẻ bên trong mã nén pdf


1
Tuyệt diệu! làm việc như người ở. xin vui lòng chỉ đổi tên địa chỉ email thành một địa chỉ hư cấu. Tôi không muốn anh chàng hư hỏng cuốn sách bị những kẻ gửi thư rác nhắm đến. Đặc biệt như anh ta có lẽ là người đã tạo ra pdf. Cảm ơn nhiều.
hnns

làm xong! Đã thay đổi chuỗi cụ thể bằng một chuỗi chung

Có ai biết làm thế nào để sửa đổi giải pháp này để thoát khỏi hình mờ liên kết? Tôi đã thoát khỏi văn bản, nhưng vẫn còn một hình vuông nhỏ nơi văn bản từng là.
425nesp

pdftk bị sập khi tôi chạy này.
Cerin

@Dingo làm thế nào để xử lý hàng loạt nó? Ý tôi là nhiều tập tin
Clain Dsilva

49

Chỉ cần thêm một chút vào câu trả lời của Dingo vì nó không hoạt động với tôi:

Trước tiên tôi phải giải nén tài liệu PDF để có thể tìm thấy hình mờ và thay thế nó sed. Bước đầu tiên liên quan đến việc giải nén tài liệu PDF bằng cách sử dụng pdftk:

pdftk original.pdf output uncompressed.pdf uncompress 

bây giờ, uncompressed.pdfcó thể được sử dụng như trong câu trả lời của Dingo:

sed -e "s/watermarktextstring/ /" uncompressed.pdf > unwatermarked.pdf

Sau đó tôi đã sửa chữa và nén lại tài liệu:

pdftk unwatermarked.pdf output fixed.pdf compress

Bạn là một người cứu rỗi cuộc sống! Cảm ơn bạn!!! :)
johndodo

1
Điều này thực sự tuyệt vời!
qed

4
Tôi đã thực hiện quá trình này, làm cho nó trở nên nhẹ nhàng hơn và gói nó trong một kịch bản Python. Đó là trên github ở đây .
Vườn Alexander

@Alexander Garden Nó không hoạt động, TypeError: str() takes at most 1 argument (2 given)khi được sử dụng theo lời khuyên sử dụng được đưa ra
8bitjunkie

2
Không hoạt động để xóa hình mờ được thêm bởi Master PDF Editor.
fccoelho

-2

Để xóa www.it-ebooks.info,

mở tệp PDF trong notepad ++ hoặc textpad

thay thế www.it-ebooks.info bằng không có gì (để trống)

lưu các tập tin

Mở trong trình đọc adobe tiêu chuẩn

Thoát, bạn sẽ được nhắc lưu tệp

lưu nó


1
Đây có phải là một giải pháp chung? Www.it-ebooks.info là gì?
Karlo
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.