Chuyển đổi HTML sang PDF tự động hợp lý (trong môi trường UNIX / Linux) [đã đóng]


16

Có cách nào để tự động tạo tài liệu PDF từ các tệp HTML trong Linux khi PDF cung cấp một số mức độ tương đồng hợp lý với tệp đầu vào không?

Một công cụ dòng lệnh - trái ngược với một loại GUI tương tác nào đó - là chìa khóa.

Tôi đã cố gắng htmldocvà một số anh em họ có liên quan, tất nhiên. Nhưng những công cụ này là vô vọng thời kỳ đồ đá; htmldochoàn toàn không hỗ trợ CSS. Bạn sẽ không tìm thấy nhiều tài liệu HTML ngày nay không có ít nhất một số kiểu CSS. Tôi không thực sự quan tâm đến các hiệu ứng ngu ngốc hoặc các chỉnh sửa nhỏ, nhưng vấn đề là CSS là cốt lõi của hầu hết các bố cục hiện nay; không có nhiều người đang sử dụng 6 lớp bảng lồng nhau nữa. Vì vậy, nếu công cụ chuyển đổi không nắm bắt được CSS, thì đó không chỉ là vấn đề "tài liệu không hoàn toàn đúng"; nó có khả năng không đáp ứng tiêu chuẩn tối thiểu về khả năng sử dụng.

Một số người đã gợi ý cho tôi để thử sử dụng công cụ kết xuất Gecko để tạo hình ảnh có thể chuyển đổi thành PDF, nhưng tôi không biết người ta sẽ làm thế nào để làm điều này, nói gì đến dễ dàng.

Tôi không gặp khó khăn khi tin rằng có những công cụ thương mại tốt để làm điều này, nhưng tôi thực sự đang tìm kiếm một gói nguồn mở nếu có thể, vì bản thân nỗ lực này là một công cụ nguồn mở và không phải trả tiền.

Cảm ơn trước!

Câu trả lời:


7

Bạn đã thấy wkhtmltopdf ? Không thể nói nó hoạt động tốt như thế nào, nhưng có vẻ như chính xác những gì bạn cần. Vấn đề duy nhất có thể là, với giải pháp này và bất kỳ giải pháp 'tự động hóa trình duyệt' nào, nó sẽ chọn biểu định kiểu in thay vì hiển thị màn hình để PDF có thể không chính xác như những gì bạn nhìn thấy trên màn hình.


Bản định kiểu in là gì? Tôi phải mất liên lạc với những thứ mới nhất và mới nhất từ ​​vũ trụ CSS.
Alex Balashov

Không có gì mới, nó chỉ trở nên thiết thực đối với hầu hết các trang web khi họ chuyển sang CSS để bố trí thay vì bảng. Hãy thử alistapart.com/articles/ gửitoprint hoặc webcredible.co.uk/user-friendly-resource/css/ ám để giới thiệu.
robertc

2

Hãy thử chm2pdf với python-beautifulsoup.


2

XHTML2PDF là một bộ công cụ Python bao gồm cả tập lệnh dòng lệnh và thư viện Python (nếu bạn muốn nhúng phần này vào một cái gì đó lớn hơn mà không cần tách ra khỏi tập lệnh.) Nó hỗ trợ HTML / XHTML và CSS, với các kiểu CSS dành riêng cho nhà cung cấp điều chỉnh đầu ra được định dạng (ví dụ: số trang, luồng đoạn, v.v.)

Tôi chỉ sử dụng nó một chút để xử lý một vài tài liệu HTML, nhưng nó hoạt động tốt và bộ tính năng của nó có vẻ toàn diện đối với tôi. Hướng dẫn được ẩn trên trang demo, nhưng, chính nó, là một ví dụ tốt về việc chuyển đổi từ tài liệu HTML sang PDF.

Tôi đã có một bộ liên kết đẹp đến các ví dụ "trước" và "sau", nhưng tôi chỉ tạo tài khoản của mình và rõ ràng, chỉ những kẻ gửi thư rác mới đặt nhiều hơn một liên kết trong bài đăng đầu tiên của họ :-p


1

Tôi muốn tạo một số PNG từ các trang HTML từ dòng lệnh. Ở đâu đó tôi tìm thấy tập lệnh ruby ​​này sử dụng mozembed để tạo ảnh chụp màn hình. Bạn có thể xóa đường tỷ lệ nếu bạn không muốn nó chia tỷ lệ.

Vấn đề duy nhất tôi thấy là trang thực sự xuất hiện trên màn hình trong giây lát ...


Hừm Phần cuối cùng có vẻ là một chút của một kẻ giết người. Điều này cần phải được đưa vào một phụ trợ hoàn toàn phía máy chủ; không có đầu hiển thị hoặc bất cứ điều gì. Có cách nào để thực hiện điều đó?
Alex Balashov

0

hãy thử dompdf nó hoạt động tốt từ de dòng lệnh và bằng các ví dụ của nó, nó hoạt động với bất kỳ loại html nào


0

Hoàng tửXML. Có thể xử lý CSS tốt. Có sẵn phiên bản Linux, Windows, Mac OS X. AFAICS, đây cũng là công nghệ đằng sau đầu ra PDF của Google Docs. Nhưng lưu ý: đây là phần mềm trả tiền.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.