Tôi muốn lưu trang web này và tất cả các trang mà nó liên kết đến. và hy vọng có cùng liên kết giữa các trang web đã lưu.
Có một số cách thay vì mở và lưu từng trang được liên kết?
Tôi muốn lưu trang web này và tất cả các trang mà nó liên kết đến. và hy vọng có cùng liên kết giữa các trang web đã lưu.
Có một số cách thay vì mở và lưu từng trang được liên kết?
Câu trả lời:
Bạn có thể làm những gì bạn thích với tiện ích dòng lệnh wget . Nếu bạn cung cấp -r
tùy chọn này, nó sẽ tải xuống đệ quy các trang web. Ví dụ:
wget -r http://mat.gsia.cmu.edu/orclass/integer/integer.html
Điều này sẽ tải xuống trang web đó và bất cứ điều gì nó liên kết đến. Bạn cũng có thể làm cho nó chỉ lặp lại một số cấp độ nhất định, để làm điều này, bạn chỉ cần cung cấp -r
một số. Giống như vậy:
wget -r 5 http://mat.gsia.cmu.edu/orclass/integer/integer.html
Chủ đề này đã cũ, nhưng những người khác có thể nhìn vào nó. Cảm ơn bạn, Wuffers, đã chỉ cho tôi đi đúng hướng, nhưng, để mở rộng câu trả lời của Wuffers: Một phiên bản hiện đại của wget có một số tùy chọn hữu ích để đệ quy các liên kết và vá chúng thành các liên kết tương đối cục bộ để bạn có thể điều hướng một bản sao cục bộ của một trang web. Sử dụng tùy chọn -r để lặp lại, tùy chọn -k để vá các liên kết cục bộ, tùy chọn -H để truy cập vào các tên miền khác với tùy chọn ban đầu, tùy chọn -D để giới hạn các miền bạn truy cập, tùy chọn -l để giới hạn độ sâu đệ quy và tùy chọn -p để đảm bảo rằng các lá của giao dịch của bạn có mọi thứ chúng cần để hiển thị chính xác. Ví dụ: phần sau đây sẽ tải xuống một trang và mọi thứ nó liên kết ngay lập tức, làm cho nó có thể duyệt được cục bộ,
wget -r -l 1 -p -k -H -D domain.com,relateddomain.com http://domain.com/page/in/domain
Sử dụng một lệnh tương tự như lệnh trên, tôi có thể tải xuống một đoạn của trang wiki, với các liên kết bên ngoài, vào đĩa cục bộ của tôi mà không cần tải xuống megabyte dữ liệu không liên quan. Bây giờ, khi tôi mở trang gốc trong trình duyệt của mình, tôi có thể điều hướng cây mà không cần kết nối Internet. Điều khó chịu duy nhất là trang gốc đã bị chôn vùi trong các thư mục con và tôi phải tạo một trang chuyển hướng cấp cao nhất để thuận tiện cho việc hiển thị. Nó có thể mất một số thử và sai để làm cho đúng. Đọc trang wget man và thử nghiệm.
Bạn có thể sử dụng trình thu thập dữ liệu trang web như omerack , miễn phí.
Từ trang web;
[omerack] cho phép bạn tải trang web World Wide Web từ Internet về thư mục cục bộ, xây dựng đệ quy tất cả các thư mục, nhận HTML, hình ảnh và các tệp khác từ máy chủ vào máy tính của bạn. HTTrack sắp xếp cấu trúc liên kết tương đối của trang web gốc. Chỉ cần mở một trang của trang web "nhân đôi" trong trình duyệt của bạn và bạn có thể duyệt trang web từ liên kết này đến liên kết khác, như thể bạn đang xem nó trực tuyến.