Trình tải xuống trang web (bộ nhớ cache?) Để xem các trang web ngoại tuyến


9

Có cách nào để tải xuống hoặc lưu trữ tất cả các trang của trang web để xem ngoại tuyến không? Tôi có chuyến bay xuyên quốc gia vào ngày mai và tôi muốn có thể lưu trữ một vài trang web (đặc biệt là trang tài liệu python ( http://docs.python.org/ ) và tài liệu tham khảo pyqt ( http: // www. riverbankcomputing.co.uk/static/Docs/PyQt4/pyqt4ref.html ).

Lý tưởng nhất là tôi muốn có một tiện ích bổ sung Firefox hoặc một cái gì đó tương tự, nhưng mọi thứ sẽ hoạt động tốt miễn là tôi có thể chạy nó trên Linux.


Bạn có thể thử trình tải xuống trang web ngoại tuyến này .
Menelaos Vergis

Câu trả lời:


15

Tôi sử dụng HTTrack .

Nó cho phép bạn tải một trang web World Wide Web từ Internet về một thư mục cục bộ, xây dựng đệ quy tất cả các thư mục, nhận HTML, hình ảnh và các tệp khác từ máy chủ vào máy tính của bạn


Tôi đã sử dụng cái này trong quá khứ, giải pháp miễn phí tốt đẹp.
MaQleod

1
HTTrack là tốt nhất cho cả Linux và Windows và có một danh sách lớn các tùy chọn để định cấu hình quá trình tải xuống .. Tôi thích nó
eslambasha

Tôi cũng đã sử dụng nó; bây giờ họ cũng cung cấp một phiên bản Android.
gparyani

-1 Nó không xây dựng "tất cả các thư mục", nó không nhận được tất cả "hình ảnh và các tệp khác" .. Nó chỉ nhận được những gì được liên kết đến.
barlop

6

Tôi sử dụng wget với các tùy chọn này để phản chiếu một trang web để sử dụng ngoại tuyến

wget -cmkE -np http://example.com/a/section/i/like

Ở đâu

-m bật tùy chọn phản chiếu để phản chiếu trang web cục bộ

-c tiếp tục tải xuống trước đó trong trường hợp tôi đã tải xuống một số trang

-k chuyển đổi tuyệt đối href để trỏ đến địa phương để xem ngoại tuyến

-E đảm bảo các tệp có phần mở rộng .html sau khi tải xuống.

-np chỉ tải xuống các đối tượng trong / a / phần / i / và không lưu trữ toàn bộ trang web.

Ví dụ: tôi muốn tải xuống tài liệu phía nam nhưng không phải vé phía nam, v.v ...

wget -cmkE -np http://south.aeracode.org/docs/index.html

Tôi sử dụng Windows và chạy wget trên cygwin nhưng cũng có một cổng wget bản địa .

Mặc dù, trong trường hợp của bạn, bạn có thể tải xuống tài liệu ngoại tuyến python từ phần tài liệu python


1

Hãy thử http://www.downthemall.net/ một plugin Firefox. Tôi đã sử dụng nó để tải xuống 250 trang PDF trong hơn 20 tệp riêng biệt. Nó vô cùng mạnh mẽ. Nó có cú pháp ký tự đại diện / truy vấn cho phép bạn phẫu thuật chỉ lấy các tệp bạn muốn và không có tệp nào không liên quan mà bạn không '.


1

Một số tiện ích mở rộng Firefox mà tôi biết:

  • Sách phế liệu

    giúp bạn lưu các trang web và dễ dàng quản lý các bộ sưu tập. Các tính năng chính là nhẹ, tốc độ, độ chính xác và hỗ trợ đa ngôn ngữ. Các tính năng chính là:

    • Lưu trang web
    • Lưu đoạn trích của trang web
    • Lưu trang web
    • Sắp xếp bộ sưu tập theo cách tương tự như Dấu trang
    • Tìm kiếm toàn văn và tìm kiếm lọc nhanh của bộ sưu tập
    • Chỉnh sửa trang Web thu thập
    • Tính năng chỉnh sửa văn bản / HTML giống như Ghi chú của Opera
  • ScrapBook Plus

    Sự khác biệt giữa ScrapBook Plus và ScrapBook:

    • sắp xếp nhanh hơn
    • xuất nhập khẩu nhanh hơn
    • mở cửa sổ để quản lý bộ sưu tập của bạn trực tiếp từ thanh bên
    • đơn giản hóa việc xử lý "Thuật sĩ kết hợp"
    • các tính năng mới cho "Chụp nhiều URL" (bộ lọc để loại trừ liên kết, sử dụng tiêu đề của trang web hoặc tiêu đề của liên kết làm tiêu đề mới cho mục nhập trong thanh bên, chỉ định thời gian chờ giữa để tải xuống từ 0 đến 3 giây, sử dụng UTF-8 hoặc ISO-8859-1 làm bộ ký tự)
    • cửa sổ "Chụp" mới (cần phải bắt đầu tải xuống theo cách thủ công, tắt cuộn tự động)
    • 6 điểm nhấn trong trình chỉnh sửa
  • Vô song

    cho phép bạn xem các tệp định dạng lưu trữ web MHT (MHTML) và lưu các trang web hoàn chỉnh, bao gồm văn bản và đồ họa, vào một tệp MHT duy nhất

  • Pocket (không phải tiện ích mở rộng; tính năng Firefox tích hợp)

    cho phép bạn lưu các trang web và video vào Pocket chỉ bằng một cú nhấp chuột. Pocket bỏ đi sự lộn xộn và lưu trang trong chế độ xem sạch sẽ, không bị phân tâm và cho phép bạn truy cập chúng khi đang di chuyển thông qua ứng dụng Pocket.

    Lưu ý rằng:

    Lưu và truy cập danh sách Pocket của bạn trên Firefox yêu cầu kết nối Internet. Có thể xem ngoại tuyến trên các thiết bị khác với ứng dụng Pocket.


0

Bạn có thể tải xuống toàn bộ trang web hoặc một phần của trang web với wget.

wget -r http://docs.python.org/

Kiểm tra hướng dẫn sử dụng wget để biết các tùy chọn khác mà bạn có thể muốn vượt qua, ví dụ: để giới hạn mức sử dụng băng thông của bạn, để kiểm soát độ sâu đệ quy, để thiết lập danh sách loại trừ, v.v.

Một cách tiếp cận khác để duyệt ngoại tuyến là sử dụng proxy lưu trữ. Wwwoffle là một tính năng có nhiều tính năng để tạo điều kiện duy trì cho trình duyệt ngoại tuyến, chẳng hạn như ghi đè lên ngày hết hạn do máy chủ chỉ định và khả năng tìm nạp trước đệ quy. (Tôi đã sử dụng wwwoffle kể từ những ngày quay số.)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.