HTML đệ quy sang PDF


12

Tôi có một thư mục với cấu trúc này:

/main-folder
 /index.html
 /subfolder1
    /index1.html
    /file1.html

với nhiều thư mục con và chỉ các tệp html ... tôi muốn chuyển đổi tất cả chúng thành pdf chỉ bằng một lệnh hoặc một tập lệnh đơn giản không yêu cầu tất cả các tên tệp.

Bạn có biết một

Câu trả lời:


15

Tôi sẽ đề nghị cài đặt công cụ WKHtmlToPDF từ http://wkhtmltopdf.org/ (được chuyển từ: http://code.google.com.vn/p/wkhtmltopdf/ ).

Sau đó, bạn có thể thay đổi thư mục gốc và sử dụng find và xargs để chuyển đổi chúng:

cd /main-folder
find . -name \*.html | sed 's/.html$//g' | xargs -n 1 --replace=X wkhtmltopdf X.html X.pdf

Điều này sau đó sẽ xây dựng một tệp PDF với mỗi tệp HTML.


tôi đã giải quyết với rất nhiều tập tin và bash cho nhưng điều này tốt hơn rất nhiều!
Matteo Pagliazzi

5

Lệnh sau sẽ thực hiện công việc cho một liên kết:

gnome-web-print http://www.ubuntu.com ubuntu.pdf

Đối với nhiều liên kết, không khó để viết một vòng lặp xử lý từng liên kết một.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.