Chuyển đổi các trang web thành một tập tin cho ebook


23

Tôi muốn tải xuống HTML (ví dụ: http://www.brpreiss.com/books/opus6/ ) và nối nó với một HTML hoặc một số định dạng khác mà tôi có thể sử dụng trên trình đọc ebook. Các trang web có sách miễn phí không có phân trang tiêu chuẩn, chúng không phải là blog hoặc diễn đàn, vì vậy không biết cách thực hiện một số thao tác thu thập dữ liệu và tự động.

Câu trả lời:


13

Bạn có thể sử dụng Calibre cho bạn nhu cầu chuyển đổi ebook. Bạn có thể lấy nó để tạo một ebook đơn gồm nhiều tệp HTML bằng cách liên kết với chúng từ một tệp HTML duy nhất mà bạn thiết lập dưới dạng mục lục như thế này .


Tôi đang sử dụng Sigil để chuyển đổi sang EPUB, nhưng không biết rằng Cailename có thể tạo một ebook từ một loạt các html được liên kết. Tôi sẽ thử, thanx!
Hrvoje Hudo

1
Bạn có thể sử dụng omerack.com để tải xuống (các) trang web, sau đó sử dụng Calibre để chuyển đổi tất cả chúng sang định dạng ePub.
에 ảnh

3
Quá trình của tôi là (sử dụng Chrome) để sử dụng bookmarklet Văn bản Instapaper để dọn dẹp mọi thứ một chút, sau đó nhấp chuột phải -> Lưu dưới dạng, chọn lưu dưới dạng một trang web, Chỉ HTML, sau đó mở trang này trong Calibre, chuyển đổi sang EPub, sau đó sử dụng chức năng Chỉnh sửa Sách để dọn dẹp bất kỳ bit đánh dấu lộn xộn nào được thêm vào.
El Yobo

6

Cách tôi từng làm việc này là Calibre.

Điều đó đã trở nên quá đau đớn, vì vậy tôi đã xây dựng Tiện ích mở rộng Chrome để làm cho nó dễ dàng hơn.

Nó được gọi là EpubPress ( http://epub.press ).

Nó cho phép bạn xây dựng một ebook từ các tab Chrome của bạn.

Mong rằng sẽ giúp!


3
Trang web trong liên kết của bạn cho thấy việc đóng gói xảy ra trên máy chủ của bên thứ 3, quyền riêng tư KHÔNG được đảm bảo với phương pháp này.
Burgi

Bạn có đề xuất cho những thay đổi sẽ làm cho bạn cảm thấy an toàn hơn? Tôi đã cố gắng hết sức để chỉ yêu cầu thông tin tối thiểu để tạo một cuốn sách, nhưng tôi sẵn sàng phản hồi thêm. Nếu bạn nhìn vào bất kỳ dịch vụ tương đương nào, bạn sẽ thấy rằng bất kỳ nội dung nào bạn muốn lưu đều được gửi đến máy chủ. Sự khác biệt là các dịch vụ đó cũng yêu cầu một tài khoản và có tất cả nội dung liên quan đến tên của bạn. Họ cũng không cung cấp mã nguồn cho trang web của họ để cho phép bạn xem những gì họ thu thập. Phần mở rộng là nguồn mở và tôi rất sẵn lòng trả lời bất kỳ câu hỏi nào về mã đó.
HaroldT

Thật là một công cụ tuyệt vời! Cảm ơn bạn rất nhiều vì đã cung cấp nó cho cộng đồng miễn phí!
vonjd

5

Pandoc có thể lấy một liên kết đến một trang (hoặc tệp html) và chuyển đổi nó thành pdf / epub ...

Tôi không chắc nó có bò không. Nếu không, bạn có thể thu thập dữ liệu các trang trước bằng wget hoặc một cái gì đó (hoặc chỉ thu thập các liên kết) và đưa nó cho pandoc.


theo trang man, nó sẽ: "Thay vì một tệp, một URI tuyệt đối có thể được cung cấp. Trong trường hợp này, pandoc sẽ lấy nội dung bằng HTTP"
jopasserat


1

HTTrack là một lựa chọn tốt - nó sẽ xây dựng ebook từ một trang web: Nó có sẵn để tải xuống từ đây: https://www.httrack.com/ HTTrack "cho phép bạn tải trang web World Wide Web từ Internet về địa phương thư mục, xây dựng đệ quy tất cả các thư mục, nhận HTML, hình ảnh và các tệp khác từ máy chủ đến máy tính của bạn. HTTrack sắp xếp cấu trúc liên kết tương đối của trang web gốc. "

Sau đó, bạn có thể chuyển đổi HTML thành EPUB, AZW3 hoặc PDF bằng Calibre hoặc bất kỳ HTML nào khác sang phần mềm chuyển đổi epub.

Tùy chọn thứ hai để chuyển đổi trực tiếp sang EPUB là EpubPress: Nó có các tiện ích mở rộng để cho phép sử dụng từ Firefox (chỉ v44.0 +) hoặc Chrome. Để sử dụng phần mềm này, bạn cần mở một cửa sổ trình duyệt. Mỗi tab về cơ bản là một "chương" trong ebook của bạn. Sắp xếp các tab theo thứ tự xuất hiện mong muốn, sau đó kích hoạt epubpress - nó sẽ tải xuống và sắp xếp các tab theo thứ tự xuất hiện của chúng, ở định dạng .epub. Hi vọng điêu nay co ich!

* Tuy nhiên, lưu ý rằng EpubPress tải xuống các trang web riêng biệt - không phải là 'trang web', tại HTTrack. Để tải xuống một trang web với EpubPress, bạn phải mở từng liên kết trên trang web dưới dạng một tab riêng biệt, sau đó sử dụng Epubpress để thu thập các liên kết này thành định dạng .epub.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.