Cách chuyển đổi PDF sang PDF / A


18

Trường đại học của tôi yêu cầu tập tin PDF nộp được ở định dạng PDF / A .

Tôi đã cố gắng tìm một công cụ chuyển đổi, nhưng tất cả chúng đều rất đắt tiền và / hoặc phức tạp.

Làm cách nào để chuyển đổi tệp PDF hiện tại của tôi thành PDF / A?

Cảm ơn rât nhiều!


1
Nếu đó chỉ là các tài liệu xử lý văn bản với định dạng đơn giản, bạn có thể mở chúng trong OpenOffice và lưu chúng dưới dạng PDF (OpenOffice có bản xuất PDF gốc nhưng tôi không biết nó có tuân thủ PDF / A không). Ngoài ra, hãy hỏi trường của bạn nếu họ có thể cung cấp bất kỳ công cụ nào, xem đó là yêu cầu của họ để làm điều này.
Thất vọngWithFormsDesigner

3
@FrustratedWithFormsDesigner: LibreOffice cho phép bạn xuất tài liệu văn bản dưới dạng PDF / A, như được giải thích ở đây .
ThatGuy

@ThatGuy -100 đọc câu hỏi: anh ấy đang yêu cầu chuyển đổi PDF !!!
Tomas

1
@Tomas: \ _ (ツ) _ / ¯ ... Tôi không trả lời câu hỏi của OP. Tôi đã phản hồi rõ ràng với FrustratedWithFormsDesigner.
ThatGuy

Câu trả lời:


5

Để lưu tài liệu Word hiện có vào PDF / A, tất cả những gì bạn cần là một phiên bản Microsoft Word gần đây. Để tạo từ các sản phẩm khác in, bạn có thể sử dụng trình tạo PDF / A miễn phí như tại www.freepdfcreator.org

Nếu bạn cần xác thực rằng tệp PDF / A tuân thủ, bạn có thể sử dụng dịch vụ miễn phí của chúng tôi tại www.validatepdfa.com

Chuyển đổi các tệp PDF hiện có thành PDF / A một cách dễ dàng hơn một chút khó khăn hơn và không phải lúc nào cũng có thể. Acrobat 9 và 10 có thể làm điều này. Doanh nghiệp của chúng tôi, Solid Documents, cũng bán một sản phẩm thực hiện điều này (và các chức năng lưu trữ phổ biến khác) với giá 99 đô la: Công cụ PDF rắn


3
Thật không may, Free PDF Creator thường khiến các chương trình tôi cố in từ bị treo hoặc gặp sự cố và nhanh chóng bật một số cửa sổ bật lên về "ưu đãi đặc biệt". Khi tôi liên hệ với bộ phận hỗ trợ của Solid Documents, tôi được thông báo rằng "Phiên bản miễn phí là bản phát hành trung gian và chúng tôi không thể xem xét các vấn đề của nó."
Mark Berry

Câu trả lời của Kurt Pfeifle dưới đây là cách tốt hơn.
mb21

16

PDF / A là một tiêu chuẩn ISO quốc tế cho một file PDF rchiving. Tiêu chuẩn yêu cầu tuân thủ nghiêm ngặt bộ quy tắc của nó (như: "nhúng tất cả các phông chữ", "không sử dụng trong suốt", "không sử dụng JavaScript", "không mã hóa", ...).

Có rất nhiều file PDF ra khỏi đó mà khẳng định là PDF / A, nhưng không một bài kiểm tra khói động sản. Khiếu nại đó chỉ là một thẻ trong siêu dữ liệu của tệp. Thẻ đó có thể làm cho trình đọc Acrobat Reader hiển thị một gợi ý đặc biệt khi kết xuất nó.

Một kiểm tra cho sự tuân thủ thực sự đòi hỏi một số phần mềm "preflight" thương mại khá mở rộng. Hiện tại tôi không biết bất kỳ tiện ích miễn phí nào để thực hiện công việc đó. Xem thêm ở đây để biết một số kết quả thử nghiệm: Isartor testsuite .

Bạn có thể sử dụng Ghostscript để (cố gắng) chuyển đổi PDF sang PDF / A. Cách thực hiện việc này được ghi lại ở đây ( Cập nhật: cho các phiên bản mới hơn tại đây ).

Nhưng lưu ý: tài liệu này chỉ được cập nhật gần đây [ * ]. Các phiên bản trước đây của Ps2pdf.htm của Ghostscript đã khiến người dùng hiểu sai khi chạy một lệnh tạo các tệp PDF tự xưng là PDF / A nhưng thất bại trong các thử nghiệm khói thực sự.

Cách chuyển đổi PDF sang PDF / A bằng Ghostscript:

Đây là một dòng lệnh:

gswin32c ^
   -dPDFA ^
   -dNOOUTERSAVE ^
   -dUseCIEColor ^
   -sProcessColorModel=DeviceCMYK ^
   -sDEVICE=pdfwrite ^
   -o output_pdfa.pdf ^
   -dPDFACompatibilityPolicy=1 ^
    PDFA_def.ps ^
    input.pdf

[ * ] Lưu ý: Vấn đề đặt ra với tham số PDFA_def.ps. Đây là một tập tin bạn cần chỉnh sửa để phù hợp với nhu cầu của bạn. Ghostscript xuất xưởng với một mẫu của nó trong /libthư mục con của nó . Đây mẫu sẽ không làm việc như nó vốn có mà không cần chỉnh sửa nó. Cách chỉnh sửa nằm trong phần bình luận của mẫu.


Vì vậy, có an toàn không khi nói rằng PDF / A không phải là định dạng tệp mỗi se, mà thực sự chỉ là một tập hợp các yêu cầu tuân thủ để tạo tệp PDF bằng công nghệ hiện có?
JohnFx

3
@JohnFx: theo một cách nào đó, vâng. Mỗi PDF / A-1b (hoặc PDF / A-1a) cũng là một PDF hợp lệ theo nghĩa chung. Nhưng không phải mọi PDF đều xác nhận thành công dưới dạng PDF / A *. Các thông số kỹ thuật PDF / A- * thực hiện 2 điều: (1) giới hạn tập hợp các tính năng được chỉ định trong thông số kỹ thuật chung PDF-1.4 ở một tập hợp con của các tính năng được phép; (2) yêu cầu tuân thủ nghiêm ngặt một số quy tắc trong thông số PDF chung là "làm hoặc không làm - như bạn muốn" (như nhúng tất cả các phông chữ được sử dụng).
Kurt Pfeifle

7

Tôi đã sử dụng lệnh sau để chuyển đổi PDF sang PDF-A:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf PDFOriginal.ps

Nếu bạn có tệp PDF, trước tiên hãy chuyển đổi nó thành PS để làm việc với mã trên. Tôi đã thử nhiều lần với tệp PDF để được chuyển đổi trực tiếp thành PDF-A. Tuy nhiên, nó đã không hoạt động.

Đây là một cách để chuyển đổi tập tin PDF của bạn sang PS:

pdftops PDFOriginal.pdf PDFOriginal.ps

Thật không may, những bản PDF này không được trường đại học của tôi chấp nhận: /
Tomas

4

Công cụ ' Save as PDF ' của Microsoft Office 2007 lưu ở định dạng PDF / A.

Tài liệu PDF / A chỉ là một tài liệu PDF sử dụng một tập hợp con cụ thể của PDF được thiết kế để đảm bảo nó là 'khép kín'. Tức là không được phép phụ thuộc vào thông tin từ các nguồn bên ngoài (ví dụ: chương trình phông chữ và siêu liên kết). Từ wikipedia :

Các yếu tố chính khác để tương thích PDF / A bao gồm:

* Audio and video content are forbidden.
* JavaScript and executable file launches are forbidden.
* All fonts must be embedded and also must be legally embeddable for
  unlimited, universal rendering. This also applies to the so-called     
  PostScript standard fonts such as Times or Helvetica.
* Colorspaces specified in a device-independent manner.
* Encryption is disallowed.
* Use of standards-based metadata is mandated.

Biên tập:

Kể từ khi không có thực sự bất kỳ công cụ để kiểm tra nếu một PDF là PDF / A, đó là một cược an toàn mà giống như bạn, trường đại học của bạn cũng không có cách nào để kiểm tra rằng tài liệu bạn gửi cho họ là PDF / A .

Có vẻ như lý do duy nhất họ yêu cầu cụ thể là vì vậy họ có thể chắc chắn rằng tất cả nội dung sẽ ở đó khi họ mở nó. Họ chỉ thể hiện yêu cầu này khá khó hiểu (và tệ hại) là nó phải là PDF / A. Vì vậy, một cách đơn giản để kiểm tra xem PDF có đáp ứng yêu cầu tự ngăn chặn thực sự của họ hay không là chuyển PDF và xem nó từ một máy tính khác (tốt nhất là ngoại tuyến) và đảm bảo rằng mọi thứ sẽ xuất hiện như mong muốn.


2
à, có cách nào để xác định xem một tệp PDF hiện có là PDF hay PDF / A không?
ben

1
@ben: Tôi không biết bất kỳ công cụ nào xác định xem PDF có thực sự là PDF / A hay không. PDF / A là một tiêu chuẩn ISO quốc tế cho một file PDF rchiving. Tiêu chuẩn yêu cầu tuân thủ nghiêm ngặt các bộ quy tắc của nó ("nhúng tất cả các phông chữ", "không sử dụng trong suốt"). Có rất nhiều file PDF ra khỏi đó mà khẳng định là PDF / A, nhưng không kiểm tra khói động sản. Khiếu nại đó chỉ là một thẻ trong siêu dữ liệu của tệp. Thẻ đó có thể làm cho trình đọc Acrobat Reader hiển thị một gợi ý đặc biệt. Một kiểm tra cho sự tuân thủ thực sự đòi hỏi một số phần mềm thương mại khá mở rộng. Tôi không biết về bất kỳ tiện ích miễn phí nào để thực hiện công việc đó.
Kurt Pfeifle

Cảm ơn thông tin Pipitas - có vẻ như ngay cả uni cũng không thể kiểm tra chắc chắn tài liệu là PDF / A, và vì vậy đó không phải là một yêu cầu khó khăn - hãy xem bản chỉnh sửa của tôi.
imoatama

@imoatama: bạn có thấy câu trả lời khác của tôi không? Nó giải thích cách chuyển đổi PDF sang PDF / A. Nếu bạn sử dụng -dPDFACompatibilityPolicy=0, PDF của bạn sẽ tự nhận là PDF / A ngay cả khi quy trình chuyển đổi của Ghostscript nhận thấy những điều không tuân thủ và không thể sửa chữa. Bạn có thể đã tạo loại PDF 'giả mạo' như tôi đã đề cập ở nơi khác ...
Kurt Pfeifle

MS Word 'lưu dưới dạng PDF' cũng khẳng định PDF là PDF / A. Không cần sử dụng Ghostscript.
imoatama

2

Trong macOSX mà không sử dụng pdftopsmà tôi không thể cài đặt (như @ soham.m17 đề xuất) bạn có thể làm:

pdf2ps oldPdf.pdf psVersionOfOldps.ps

để chuyển đổi định dạng pdf sang ps và sau đó:

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=MyOutPutPDF-A.pdf psVersionOfOldps.ps

để chuyển đổi trong pdf / A.


1

Cách duy nhất hiệu quả với tôi trên Windows 10 là sửa đổi một chút câu trả lời của soham (đối với tôi là làm việc nhưng có lỗi):

  • chuyển đổi PDFthành ps(với pdf2ps source.pdf temp.ps)
  • chuyển đổi lại psthành PDF/Asử dụng Ghostscript 9.22 với

gswin64c -dPDFA -dBATCH -dNOPAUSE -dPDFSETTINGS=/prepress -dNOOUTERSAVE -sColorConversionStrategy=UseDeviceIndependentColor -sProcessColorModel=DeviceRGB -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=destination.pdf temp.ps

(Bạn có thể cần thêm trước gswin64cđường dẫn hoàn chỉnh, đối với tôi là C:\Program Files\gs\gs9.22\bin\- tương tự pdf2ps, trong trường hợp này, đường dẫn cho tôi là C:\Program Files\gs\gs9.22\lib\)

Nếu tệp kết quả quá lớn, bạn có thể bỏ qua -dPDFSETTINGS=/prepresstùy chọn. Nếu không có tùy chọn này, tệp kết quả sẽ nhỏ hơn (thậm chí nhỏ hơn bản gốc trong trường hợp của tôi), nhưng sự suy giảm chất lượng hình ảnh có thể được ghi nhận.

Kết quả PDFdường như phù hợp PDF/Angay cả khi không có -dNOOUTERSAVEtùy chọn, mặc dù ít phông chữ được nhúng hơn (có thể ai đó có thể giải thích sự khác biệt).

Khi tôi nói "phù hợp với PDF/A" tôi không chỉ có nghĩa là PDF/A"biểu ngữ" hiển thị trên Acrobat Reader mà tệp còn vượt qua xác thực trực tuyến được cung cấp bởi https://www.pdf-online.com/osa/validate.aspx

Tôi không biết dịch vụ xác thực trực tuyến như vậy đáng tin cậy đến mức nào, tuy nhiên nó đã quản lý để phát hiện các tệp không tuân thủ đang hiển thị PDF/A"biểu ngữ" trên Acrobat Reader (do đó có vẻ không đáng tin về mặt này).


0

Câu trả lời đơn giản:

Bạn có thể cài đặt Libre Office , nó miễn phí

Mở tệp PDF và lưu dưới dạng PDF ... [kiểm tra tùy chọn PDF / A]

...bạn đã hoàn tất!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.