Nhận biết
Tôi tìm thấy công cụ này có vẻ là những gì bạn có thể sử dụng để xác định các tệp PDF / A. Nó được gọi là DROID (Bản ghi kỹ thuật số và nhận dạng đối tượng) . Nó dựa trên Java và có thể được chạy từ GUI hoặc dòng lệnh.
đoạn trích
DROID là một công cụ phần mềm được phát triển bởi Lưu trữ Quốc gia để thực hiện nhận dạng hàng loạt các định dạng tệp tự động. Được phát triển bởi Cục bảo tồn kỹ thuật số như là một phần của hoạt động bảo quản kỹ thuật số rộng lớn hơn, DROID được thiết kế để đáp ứng yêu cầu cơ bản của bất kỳ kho lưu trữ kỹ thuật số nào để có thể xác định định dạng chính xác của tất cả các đối tượng kỹ thuật số được lưu trữ và liên kết nhận dạng đó với đăng ký trung tâm thông tin kỹ thuật về định dạng đó và các phụ thuộc của nó.
Được tài trợ bởi Lưu trữ Quốc gia, tôi sẽ cho rằng đó là công cụ phù hợp để thực hiện việc này, dựa trên mục đích dự định của định dạng PDF / A. Ngoài ra, dự án là nguồn mở và mã có sẵn trên Github cũng như được đóng gói ở dạng nhị phân từ trang web Lưu trữ Quốc gia .
Xác nhận & chuyển đổi
Nếu bạn đang tìm kiếm một công cụ để thực hiện xác nhận & chuyển đổi, tôi tin rằng PDFBox có thể làm điều này. PDFBox liệt kê xác thực PDF / A ngay trên trang đầu của trang web của họ. Đây là một ứng dụng Java khác 8-).
trích đoạn từ trang web
Xác thực PDF / A Xác
thực các tệp PDF theo tiêu chuẩn PDF / A ISO.
Trong phần công cụ dòng lệnh ở bên trái trang chính của chúng, hiển thị cách sử dụng sau cho công cụ:
$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>
veraPDF là một công cụ khác có khả năng xác nhận PDF / A; nó là một phần của bộ công cụ tham khảo của Tổ chức bảo tồn mở. Đây cũng là một ứng dụng Java.
Chuyển đổi
Để thực hiện chuyển đổi, tôi đã tìm thấy phương pháp này từ một bài đăng trên blog có tiêu đề: Cách miễn phí để chuyển đổi PDF hiện có sang PDF / A , sử dụng các công cụ sau:
- Ghostscript 8.64 Chỉ.
- PDFBox 0.7.3
- pdfmark (tệp để cung cấp dữ liệu meta bổ sung)
- PDFA_def.ps
- USWebCoatedSWOP.icc
Với cách trên, bạn sử dụng lệnh sau:
$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf
Không phải là không có mụn cóc. Bài báo thảo luận về một trong số họ, sửa các cờ in trên các siêu liên kết là một trong số đó. Bài viết cung cấp một ứng dụng Java mà bạn có thể sử dụng để sửa các lỗi sau:
$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf
Nó không đẹp nhưng có vẻ khả thi. Xem bài viết để biết thêm chi tiết.
Người giới thiệu