Tôi muốn tải xuống toàn bộ trang web (với các trang web phụ). Có công cụ nào cho việc đó không?
--convert-links
trong wget) sẽ không tiết lộ các trang web chỉ được tiết lộ bằng cách gửi biểu mẫu, trong số những thứ khác.
Tôi muốn tải xuống toàn bộ trang web (với các trang web phụ). Có công cụ nào cho việc đó không?
--convert-links
trong wget) sẽ không tiết lộ các trang web chỉ được tiết lộ bằng cách gửi biểu mẫu, trong số những thứ khác.
Câu trả lời:
Hãy thử ví dụ 10 từ đây :
wget --mirror -p --convert-links -P ./LOCAL-DIR WEBSITE-URL
–mirror
: bật tùy chọn phù hợp để phản chiếu.
-p
: tải xuống tất cả các tệp cần thiết để hiển thị đúng một trang HTML đã cho.
--convert-links
: sau khi tải xuống, chuyển đổi các liên kết trong tài liệu để xem cục bộ.
-P ./LOCAL-DIR
: lưu tất cả các tập tin và thư mục vào thư mục được chỉ định.--wait=seconds
đối số nếu bạn muốn thân thiện hơn với trang web; nó sẽ đợi số giây được chỉ định giữa các lần truy xuất.
Với wget
bạn có thể tải xuống toàn bộ trang web, bạn nên sử dụng -r
chuyển đổi để tải xuống đệ quy . Ví dụ,
wget -r http://www.google.com
WEBHTTRACK WEBSITE COPIER là một công cụ tiện dụng để tải toàn bộ trang web xuống đĩa cứng của bạn để duyệt ngoại tuyến. Khởi chạy trung tâm phần mềm Ubuntu và gõ "máy photocopy trang web webhttrack" mà không có dấu ngoặc kép vào hộp tìm kiếm. chọn và tải xuống từ trung tâm phần mềm vào hệ thống của bạn. bắt đầu webHTTrack từ trình duyệt hoặc trình đơn bắt đầu, từ đó bạn có thể bắt đầu thưởng thức công cụ tuyệt vời này để tải xuống trang web của mình
Tôi không biết về tên miền phụ, tức là các trang web phụ, nhưng wget có thể được sử dụng để lấy một trang web hoàn chỉnh. Hãy xem câu hỏi siêu người dùng này . Nó nói rằng bạn có thể sử dụng -D domain1.com,domain2.com
để tải xuống các tên miền khác nhau trong một tập lệnh. Tôi nghĩ bạn có thể sử dụng tùy chọn đó để tải xuống tên miền phụ tức là-D site1.somesite.com,site2.somesite.com
Tôi sử dụng Burp - công cụ nhện thông minh hơn wget và có thể được cấu hình để tránh các phần nếu cần thiết. Bản thân Burp Suite là một bộ công cụ mạnh mẽ để hỗ trợ thử nghiệm, nhưng công cụ nhện rất hiệu quả.
Bạn có thể tải xuống Toàn bộ trang web Lệnh:
wget -r -l 0 website
Thí dụ :
wget -r -l 0 http://google.com
Nếu tốc độ là một mối quan tâm (và sức khỏe của máy chủ thì không), bạn có thể thử puf , hoạt động như wget nhưng có thể tải xuống nhiều trang song song. Tuy nhiên, nó không phải là một sản phẩm hoàn chỉnh, không được bảo trì và không có giấy tờ khủng khiếp. Tuy nhiên, để tải xuống một trang web có rất nhiều tệp nhỏ, đây có thể là một lựa chọn tốt.