Làm cách nào để xóa hình mờ khỏi tệp PDF?


41

Tôi nghĩ rằng đây sẽ là một nhiệm vụ đơn giản, nhưng nó lại diễn ra theo một cách khác.

Hình mờ là hình ảnh rất giống nhau (chồng chéo, nhưng trong suốt) trên mỗi trang. Tôi đã tự tạo tệp PDF (vì vậy không phải lo lắng về bản quyền ở đây) bằng PDFCreator 0.9.8.

Tôi đã dùng thử Adobe Acrobat Pro của bạn tôi, nhưng nó không hoạt động. Nó cố gắng để loại bỏ nó, nhưng nó không thể. Tôi đã cố xóa tiêu đề / chân trang, v.v., nhưng hình mờ sẽ không biến mất.

Làm thế nào tôi có thể loại bỏ watermark?


2
PDF là một định dạng đầu ra, giống như một trang in điện tử. Nó không có nghĩa là phải được chỉnh sửa và trong hầu hết các trường hợp, bạn sẽ không thể thực hiện những gì bạn yêu cầu khi xuất các trang thành hình ảnh và photoshop ra các hình mờ.
mk12

Khuyến nghị mua sắm là chủ đề cho tất cả các trang web trao đổi ngăn xếp. Để ngăn câu hỏi này kết thúc, tôi khuyên bạn nên thay đổi câu hỏi thành câu hỏi như thế nào, thay vì câu hỏi nào
Luke Luke REINSTATE MONICA của Canada

3
Có vẻ như bạn chỉ cần sử dụng PDFCreator 0.9.8 và đặt tùy chọn để hình mờ không được thêm vào mỗi trang. Tôi cho rằng câu hỏi này là vì bạn không có nguồn gốc.
Ramhound

Câu trả lời:


73

Đối với hình mờ dựa trên hình ảnh, có một số công cụ hứa hẹn loại bỏ tự động. Ví dụ:

Tất cả đều miễn phí để thử, nhưng yêu cầu phải có giấy phép để thực sự tạo ra đầu ra mong muốn.

Tuy nhiên, hình mờ của tệp PDF cụ thể này (mà OP đã gửi cho tôi qua email) không phải là một hình ảnh duy nhất được lặp lại trên tất cả các trang. Khi nó bật ra, PDFCreator đã mã hóa nó (gần như từng pixel theo pixel) vào mỗi một trong số chúng. Điều này làm cho hình mờ khó khăn hơn nhiều để loại bỏ (và dẫn đến một tệp PDF khá cồng kềnh).

Vì hình mờ thực sự bao gồm nhiều hình ảnh nhỏ, bạn có thể xóa chúng bằng trình chỉnh sửa PDF (ví dụ: Foxit Advanced PDF Editor ), chỉ bằng cách chọn chúng và nhấn Delete. Thật không may, bạn phải lặp lại điều này cho mỗi trang.

Một giải pháp ít tốn thời gian hơn sẽ là loại bỏ hình mờ theo chương trình. Chúng tôi cần:

Các bước

  1. Tải xuống Pdftk và trích xuất pdftk.exelibiconv2.dll để % Windir% \ System32 , một thư mục trong đường dẫn hoặc bất kỳ vị trí nào bạn chọn.

  2. Tải xuống và cài đặt Notepad ++.

  3. Các luồng PDF thường được nén bằng thuật toán DEFLATE . Điều này tiết kiệm không gian, nhưng nó làm cho nguồn PDF không thể đọc được.

    Lệnh

    pdftk original.pdf output uncompressed.pdf uncompress
    

    giải nén tất cả các luồng, do đó chúng có thể được sửa đổi bởi trình soạn thảo văn bản.

  4. Mở unsompression.pdf bằng Notepad ++ để hiển thị cấu trúc của hình mờ.

    Trong trường hợp cụ thể này, mọi trang bắt đầu bằng khối

    q 9 0 0 9 2997 4118.67 cm
    BI
    /CS/RGB
    /W 1
    /H 1
    /BPC 8
    ID Ÿ®¼
    EI Q
    

    và gần 4.000 khối giống như cái này. Khối cụ thể này chỉ đặt một ( /W 1 /H 1) pixel của hình mờ.

    Cuộn xuống cho đến khi thay đổi mẫu cho thấy luồng của hình mờ dài 95,906 byte (tính dòng mới). Luồng chính xác được lặp lại trên mỗi trang của tệp PDF.

  5. Nhấn Ctrl+ Hvà đặt như sau:

    Find:               q 9 0 0 9 2997 4118\.67 cm.{95881}
    Replace:            (blank)
    Match case:         checked
    Wrap around:        checked
    Regular expression: selected
    . matches newline:  checked
    

    Biểu thức chính quy q 9 0 0 9 2997 4118\.67 cm.{95881}khớp với dòng đầu tiên của khối trên ( q 9 0 0 9 2997 4118.67 cm) và tất cả 95.881 ký tự sau, tức là luồng hình mờ.

    Nhấp vào Thay thế Tất cả sẽ xóa nó khỏi tất cả các trang của tệp PDF.

  6. Hình mờ hiện đã bị xóa, nhưng tệp PDF có lỗi (độ dài của luồng không chính xác) và nó không bị nén.

    Lệnh

    pdftk uncompressed.pdf output nowatermark.pdf compress
    

    chăm sóc cả hai.

  7. unsompression.pdf không còn cần thiết. Bạn có thể xóa nó.

Kết quả là cùng một tệp PDF không có hình mờ (và khoảng một nửa kích thước).


4
Một mẹo khác mà tôi thấy hữu ích: Thật khó cho tôi để tìm ra khối tương ứng với hình mờ trong tệp PDF của tôi. Vì vậy, những gì tôi đã làm là chỉ trích xuất một trang duy nhất từ ​​PDF, lý tưởng là một trang chỉ có hình mờ và không có nhiều hình khác. Chỉ từ một trang này, việc tìm ra khối tương ứng với hình mờ sẽ dễ dàng hơn. Sau đó quay lại và làm điều đó cho bản PDF gốc.
Kenny LJ

1
Ồ, đây là nơi đầu tiên trên internet tôi đã tìm thấy một cách tốt để quản lý việc này. Bất kỳ nơi nào bạn đề nghị đọc lên trên định dạng container?
ConstantineK

2
@hobs IIRC, tôi đọc các phần của tài liệu tham khảo PDF chính thức để viết câu trả lời này.
Dennis

1
Cảm ơn @Dennis, tôi đã cung cấp cho bạn một upvote, nhưng đây dường như là nguồn kinh điển tốt nhất. Tôi đã có thể nhận được những gì tôi cần chỉ bằng một số tìm kiếm / thay thế và một vài lần chạy thử và nén lỗi bổ sung. HÃY GIÚP Đ !!
ConstantineK

7
Thay vì pdftkbạn cũng có thể sử dụng qpdf để giải nén và nén các tập tin pdf. Các lệnh: qpdf --stream-data=uncompress original.pdf uncompressed.pdfqpdf --stream-data=compress uncompressed.pdf nowatermark.pdf
David Schuler

6

Nghe có vẻ như hình mờ thực sự là một phần của hình ảnh trong .PDF và không phải là hình ảnh riêng biệt được hiển thị trên nó bởi bất cứ điều gì bạn đang sử dụng để hiển thị .PDF. Bạn không thể xóa hình mờ mà không trích xuất hình ảnh từ .PDF, chạy chúng thông qua trình chỉnh sửa hình ảnh, sau đó xây dựng lại .PDF theo cách thủ công.


4

Đối với hình mờ văn bản, chỉnh sửa phiên bản PostScript có thể dễ dàng hơn nhiều: Sau

$ pdftops document.pdf

chỉnh sửa document.ps, sau đó chuyển đổi trở lại PDF qua

$ ps2pdf tài liệu.ps


Trên Linux, hãy cẩn thận pdftopspdf2pskhác biệt. Sử dụng lệnh đầu tiên, không phải thứ hai.
Camille Goudeseune

1
Nếu bạn biết văn bản watermark là gì, đây là một lớp lót. pdftops in.pdf - | sed 's/WATERMARK//' | ps2pdf - out.pdf
Camille Goudeseune

1

Các thành phần của tem là bạn có thể xóa nó trong Adobe Acrobat Pro, tuy nhiên, nó sẽ tái tạo khi di chuyển chuột vì đối tượng truyền phát giữ cho nó bền bỉ.

Nếu bạn cố gắng chỉnh sửa nguồn pdf - rất khó, có khả năng tệp sẽ bị hỏng.

Nếu tem là một luồng, chúng ta có thể làm gián đoạn nó bằng cách ngắt kết nối máy tính khỏi Net, điều mà tôi đã làm.

Sau đó, sử dụng Adobe Acrobat Pro, tôi đã chọn một trong các chú thích của mình, nhấp chuột phải để nhận cửa sổ bật lên và chọn "Hiển thị danh sách nhận xét".

Chọn hình mờ / tem bất chính từ Danh sách, nhấp chuột phải để nhận cửa sổ bật lên và chọn "Xóa". Làm điều này trên mỗi trang nơi xảy ra sự gắn kết.

Lưu tệp dưới tên khác. Ứng dụng của tôi bị sập, nhưng không phải trước khi lưu tệp!

Mở tệp mới & nhỏ hơn nhiều; lưu ý rằng tất cả các hình mờ / tem là gonzo.

Trong trường hợp của tôi, kích thước tệp của tài liệu 3 trang của tôi đã giảm từ 300 kb xuống còn 60 kb ấn tượng. Tất cả các dữ liệu và chú thích ban đầu vẫn còn nguyên vẹn - bao gồm các hình mờ.

~ Săn bắn tốt: o)


1

chuyển đổi tài liệu thành tập tin .rtf bằng zamzar. Dấu nước tự động biến mất sau khi chuyển đổi. Xin lưu ý: - Nó hoạt động hoàn hảo nếu tài liệu có chứa tài liệu văn bản. Nó luôn giúp ích rất nhiều .. (người dùng Mac)


Điều này không hoạt động cho PDF tôi đã thử.
Kenny LJ

1

Tìm thấy một cách khác để làm điều đó:

  1. Sử dụng công cụ pdf2htmlEX (hoặc bất kỳ trình chuyển đổi PDF sang HTML nào khác) để chuyển đổi PDF thành tệp HTML.
  2. Chỉnh sửa HTML bằng trình soạn thảo văn bản và xóa hình mờ. Lưu nó
  3. In ra HTML sang tài liệu PDF mới
  4. Lợi nhuận

Cảm ơn bạn. Bạn có chắc chắn rằng bạn không thể xóa hình mờ bằng Adobe Acrobat theo cách này? (Đây có thể là một giải pháp rẻ hơn.)
Apache

Tôi tin rằng bạn cần một số loại mật khẩu để xóa hình mờ trong trình đọc Adobe, do đó tôi đã sử dụng phương pháp này.
Dominik Antal

0

Đây là phần bổ sung cho câu trả lời của @Dennis ngày 18:06 ngày 30 tháng 7 năm 2012. Anh ấy chắc chắn giải quyết trường hợp khó hơn.

Trong trường hợp đơn giản nhất, ví dụ hình mờ là văn bản đơn giản, không có văn bản

Smedley cho ủy viên

hình mờ PDF không nén có thể được định nghĩa như thế này:

    BT
    75.96 625 Td
    (Smedley For Commissioner)Tj
    ET

trong đó 75.96là bù ngang và 625bù dọc cho trường hợp hình mờ cụ thể này. (Có, có thể nhìn thấy cả số thực và số nguyên.)

Một biểu thức chính quy như sau sẽ hoạt động cho tất cả các hình mờ như vậy, bỏ qua mọi biến thể trong vị trí của chúng:

^BT\n[0-9.]+ [0-9.]+ Td\n\(Smedley For Commissioner\)Tj\nET\n

Xin lưu ý rằng, một loạt các toán tử sửa đổi PDF có thể hoạt động với các hình mờ có định dạng phức tạp hơn. Sự huyền ảo như vậy có thể biến những gì người đọc mong đợi (hy vọng?) Trở thành một chuỗi liên tục, dễ tìm kiếm thành một mớ hỗn độn của bảng chữ cái. Ví dụ,

E 1 = mc² bởi Smedley ™

Có thể là sản phẩm của điều này:

    BT
    75.96 625 Td
    (E)Tj
    -5 Ts
    (1)Tj
    0 Ts
    ( = mc)Tj
    5 Ts
    (2)Tj
    0 Ts
    (by Smedley)Tj
    5 Ts
    (TM)Tj
    0 Ts
    ET

. . . hoặc tệ hơn nhiều nếu watermark của bạn được tăng cường màu sắc!

Đã lưu ý tất cả những điều này, tôi cũng sẽ lưu ý rằng PDFtk có phiên bản GUI có thể xử lý các hình mờ, xem xét về phí cấp phép 4 đô la. Không đắt chút nào!

Mặt khác, tôi thấy trang web của nó hiện đang quảng cáo hỗ trợ đầy đủ cho O / S thông qua Windows 8OS X 10.8 Mountain Lion. Đó là cổ điển hơn 4 năm trước. PDFtk có thể bị lỗi thời? Tôi nghi ngờ là không, nhưng tôi không biết.


Cảm ơn bạn đã giới thiệu PDFtk, trông gọn gàng, nhưng vâng cũng "có mùi" một chút oud. Phiên bản miễn phí là 2.02 và Wikipedia nói rằng nó thực sự đã được phát hành 3 năm trước: en.wikipedia.org/wiki/PDFtk
Apache

1
@Shiki - thực ra, tôi đã thực hiện một số nghiên cứu nghiêm túc về các định dạng PDF, nhưng đã loại bỏ đánh giá chi tiết về tiến trình PDF trong 10 năm qua. Dưới đây là tóm tắt: "Những thiếu sót của bản phát hành PDF 3k trong bối cảnh phát triển thông số PDF." Mặc dù đã có một vài cập nhật kể từ năm 2005, nhưng bạn sẽ ổn với _PDFtk_ trong mọi khả năng. Tôi nói điều này sau khi kiểm tra một số nguồn tài liệu PDF hiện đại, phổ biến. Tất cả các tài liệu PDF mà tôi đã kiểm tra đã được tạo theo tiêu chuẩn PDF trước năm 2010 ( thực tế là trước đây .) Nếu bạn có bất kỳ nghi ngờ nào, hãy kiểm tra vài chục byte hàng đầu của tệp PDF được đề cập.
Der Schley

0

Dưới đây là những cách miễn phí và trả phí để làm điều đó, tôi khuyên bạn nên sử dụng Google Drive.

Google Drive có khả năng mở tệp và thực hiện một số chỉnh sửa nhỏ. Ngoài ra, nó có thể được sử dụng để xóa hình mờ khỏi PDF trực tuyến.

  1. Mở tài khoản Google Drive của bạn, về cơ bản giống như tài khoản Gmail của bạn.
  2. Nhấp vào, New New New York> Tải lên tập tin, hãy chọn một tài liệu PDF và sau đó tải nó lên.
  3. Sau khi hoàn tất, bạn có thể kiểm tra tệp đã tải lên trên Ổ đĩa của mình, sau đó nhấp chuột phải để mở tệp đó bằng Google Google Docs.
  4. Sau đó, watermark của bạn sẽ được xóa tự động. Để lưu nó, hãy truy cập vào File File và nhấp vào Tải xuống Tải xuống dưới dạng rọ và sau đó chọn tài liệu PDF PDF.
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.