Làm cách nào tôi có thể tải xuống một trang web và các liên kết mà nó tham chiếu, nhưng không có gì hơn? [bản sao]


2

Câu hỏi này đã có câu trả lời ở đây:

Tôi có một danh sách các liên kết ở đây: https://docs.oracle.com/javase/tutorial/reallybigindex.html

Rằng tôi muốn tất cả tải về. Có ai biết làm thế nào điều này sẽ đi?


Điều gì định nghĩa "không có gì hơn"?
ngẫu nhiên

@random Đối với tôi có vẻ lạ khi điều này được đánh dấu là trùng lặp khi trang web được đề cập cung cấp một tệp zip chứa các trang cần thiết (xem câu trả lời của tôi). Tại sao lại đi tìm giải pháp chung khi có một giải pháp cụ thể ( không được nêu trong bản dupe) cho câu hỏi của OP?
DavidPostill

Đó là bản sao của cách tải xuống một trang web và tất cả các liên kết nhưng không phải tất cả các liên kết (vì vẫn chưa được làm rõ) hoặc nằm ngoài phạm vi vì muốn tải xuống một tài nguyên cụ thể @dav
ngẫu nhiên

Câu trả lời:


2

Bạn có thể tải xuống Wget cho Windows và sử dụng từ cmd.exe:

wget -r -l 2 https://docs.oracle.com/javase/tutorial/reallybigindex.html

Nếu bạn cũng muốn các hình ảnh và tệp CSS cho các trang đó, sau đó thêm -pvà cũng -kđể thay đổi các liên kết trong HTML để bạn có thể duyệt các trang này ngoại tuyến.

Hướng dẫn này có một số ảnh chụp màn hình có thể giúp đỡ.

Giá trị của -l 2sẽ có được trang đầu tiên đó và tất cả các trang mà nó liên kết đến. Bạn có thể tăng số lượng để có được các trang sâu hơn, nhưng tôi sợ nó sẽ theo một số liên kết từ các hướng dẫn và xung quanh trang web của Oracle.

Ngoài ra, bạn có thể thử VisualWget có UI!

Ngoài ra, bạn có thể muốn tải về các hướng dẫn ở dạng ebook .


1

Làm cách nào tôi có thể tải xuống một trang web và các liên kết mà nó tham chiếu

Tôi có một danh sách các liên kết ở đây: https://docs.oracle.com/javase/tutorial/reallybigindex.html

Thay vì tải xuống tất cả các liên kết trong "Chỉ số thực sự lớn", việc tải xuống gói Hướng dẫn Java mới nhất sẽ dễ dàng hơn .

Nó có sẵn trong nhiều định dạng - zip, epub và mobi.

tutorial.zipbao gồm reallybigindex.htmlvà tất cả các tệp được tham chiếu.

Dưới đây là nội dung cấp cao nhất của tệp zip được mở rộng:

enter image description here


1

Có nhiều cách để tiếp cận điều này. Không biết sản phẩm cuối cùng mong muốn của bạn, tôi không thể rất cụ thể.

  • wget , như được đề xuất bởi @joeytwiddle
  • cuộn tròn (tương tự như wget)
  • tờ Google
  • tiện ích bổ sung cho trình duyệt cho Chrome hoặc Firefox (trình quét tìm kiếm )

Tôi sẽ mở rộng trên Google Sheets (Tôi sử dụng điều này cho các dự án đơn giản một lần):

  • tạo một tờ mới
  • đặt cái này vào ô a1 https://docs.oracle.com/javase/tutorial/reallybigindex.html
  • đặt cái này vào ô b2 =IMPORTXML(A1, "//a[@href]/text()")(cái này lấy văn bản của cái nhấp chuột)
  • đặt cái này vào ô e2 =IMPORTXML(A1, "//a[@href]/@href")(cái này lấy URL)

Tham số thứ hai của hàm là biểu thức xpath . Bạn sẽ cần điều chỉnh những cái đó để có được kết quả mà bạn muốn. Có rất nhiều người kiểm tra xpath trực tuyến để giúp bạn làm điều này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.