Tạo pdf từ sách HTML


16

Có một số trang web cung cấp sách dưới dạng trang HTML (ví dụ: nội dung hợp pháp).

Tôi có thể sử dụng gì để tạo sách PDF từ các trang này, dựa trên cấu trúc đã tồn tại?

Trong Windows có Adobe Professional (phần mềm thương mại). Tôi đoán rằng Linux có cái gì đó miễn phí? Một giải pháp liên quan đến kịch bản sẽ ổn với tôi.

Câu trả lời:


9

Calibre là một công cụ khá mạnh mẽ để chuyển đổi mọi thứ thành sách điện tử ở các định dạng khác nhau. Có sẵn trong một Trung tâm phần mềm gần bạn!

Đừng để bị đánh lừa bởi giao diện người dùng kém đẹp, nó có thể làm được rất nhiều.


1
calibre cũng đi kèm với một công cụ dòng lệnh, ebook-convert. Vì vậy, với điều đó bạn có thể làm for file in *.html ; do ebook-convert "$file" "${file%.html}.pdf" ; donevà nó sẽ chuyển đổi tất cả các tệp html trong thư mục thành PDF.
frabjous

1
Đây là một công cụ tốt, tôi cũng là người dùng Calibre, tôi nghĩ rằng công cụ mới nhất đã đánh dấu những cải tiến trong giao diện người dùng.
Sabacon

4

Cách dễ nhất? Tệp> In từ trình duyệt của bạn. Chọn Print to File làm máy in của bạn và nó sẽ hỏi bạn nơi bạn muốn. Hãy chắc chắn để đánh dấu PDF. Nhấn "In" và nó thực sự sẽ được lưu vào ổ đĩa của bạn thay vì thực sự in.


Cảm ơn. Có rất nhiều tập tin, mặc dù. Sự điều động này là thực tế không thể.
Lucian Sasu

4

Htmldoc có thể hữu ích, xem nó ở đây; http://www.htmldoc.org/ nó có sẵn từ trung tâm phần mềm, đáng buồn là phiên bản 1.8 có vấn đề với các tệp được mã hóa unicode nhưng trong nhiều trường hợp, nó vẫn có thể là một vị cứu tinh, vấn đề được khắc phục trong phiên bản phát triển 1.9.

Tôi thường sử dụng phần mở rộng sổ lưu niệm tuyệt vời ở đây; http://amb.vis.ne.jp/mozilla/sczeria/ để Firefox chụp các trang web, sử dụng các công cụ chỉnh sửa trong sổ lưu niệm để sửa chúng nếu cần và sau đó sử dụng htmldoc để chuyển đổi tất cả các trang sang PDF.



3

Tôi khuyên bạn nên sử dụng OpenOffice / LibreOffice để tạo PDF. Để thử nghiệm, tôi đã tải xuống Wget manul (tất cả trong một trang) và sau đó mở trang HTML trong OponOffice và nhấp vào nút "Xuất trực tiếp sang PDF". Nó tạo ra PDF với một chỉ mục từ mục lục.

Trước đây, tôi thấy đây là cách dễ nhất để chuyển đổi các trang HTML sang PDF. Nó cũng cho phép bạn thực hiện các thay đổi mà không cần nỗ lực nhiều.

Ảnh chụp màn hình:

  • Wget hướng dẫn xuất sang PDF bằng Open Office Wget hướng dẫn xuất sang PDF bằng Open Office

  • Xuất trực tiếp sang tùy chọn PDF trong Open Office Xuất trực tiếp sang tùy chọn PDF trong Open Office


Bất kỳ ý tưởng nào nếu cuốn sách không ở trong một trang, nhưng được phân chia theo nhiều mục / phần?
Ciprian Tomoiagă

2

Tôi thực sự đã bỏ phiếu cho giải pháp tầm cỡ. Nhưng đây là một cái khác bạn có thể thử. Cài đặt AbiWord . Nó có thể thực hiện chuyển đổi giữa bất kỳ định dạng nào mà nó biết từ dòng lệnh. Để chuyển đổi tất cả các tệp .html trong một thư mục thành .pdf bạn có thể làm:

for file in *.html ; do abiword --to=pdf "$file" ; done

Đối với kiểu chữ cấp cao hơn (nhưng có thể phức tạp hơn), một tùy chọn khác sẽ là PrinceXML .


2

Tùy thuộc vào tài liệu html được in, bạn có thể có kết quả tốt nhất khi sử dụng pandoc . Đây là một trong những trình chuyển đổi HTML-sang-LaTeX linh hoạt nhất. Tệp .tex kết quả có thể được chuyển thành PDF khá dễ dàng, bằng cách sử dụng xelatexhoặc pdflatex. Có rất nhiều tùy chọn có sẵn nếu bạn sẵn sàng đi sâu vào các gói và cú pháp LaTeX. Điều này có thể không hoạt động tốt nếu hình ảnh nhúng và kiểu HTML ưa thích nên được giữ nguyên.


1

Trong google-chrome, bạn có thể tạo tệp pdf cho toàn bộ trang web bằng cách sử dụng tiện ích mở rộng. Cá nhân tôi sử dụng tiện ích mở rộng Trình chuyển đổi Web2PDF để tạo tệp PDF chỉ bằng một cú nhấp chuột.

Dưới đây là một ảnh chụp màn hình của plugin này, được cung cấp bởi trang web cửa hàng mở rộng google.

nhập mô tả hình ảnh ở đây

Ngoài ra, bạn có thể thấy một tệp PDF do tôi tạo bằng công cụ này, bằng cách tải xuống bản tiếp theo (clic bên phải, lưu mục tiêu dưới dạng): http://geppettvs.servehttp.com/resource/askubfox-com.pdf (một số trình duyệt như google- chrome có thể cho phép bạn xem trực tuyến này).

Và nếu bạn muốn chỉnh sửa các tệp PDF được tạo bởi tiện ích mở rộng để xóa chữ ký số được đặt bởi tiện ích mở rộng ở cuối mỗi trang hoặc xóa bất kỳ nội dung nào khác, hãy xem điều này: Xóa thông tin văn bản khỏi tệp PDF?

Chúc may mắn!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.