Câu trả lời:
Tôi luôn yêu thích cái tên này: SiteSucker .
CẬP NHẬT : Phiên bản 2.5 trở lên không còn miễn phí nữa. Bạn vẫn có thể tải xuống các phiên bản trước đó từ trang web của họ.
Bạn có thể sử dụng wget với --mirror
công tắc của nó .
wget --mirrorTHERw 2 từ chối --HTML-phần mở rộng-chuyển đổi liên kết mộcP / nhà / người dùng / sitecopy /
trang man cho các công tắc bổ sung ở đây .
Đối với OSX, bạn có thể dễ dàng cài đặt wget
(và các công cụ dòng lệnh khác) bằng cách sử dụng brew
.
Nếu việc sử dụng dòng lệnh quá khó khăn, thì Cốc Cốc là một GUI OS X cho wget
. (Phiên bản 2.7.0 bao gồm wget 1.11.4 từ tháng 6 năm 2008, nhưng nó hoạt động tốt.)
wget --page-requisites --adjust-extension --convert-links
khi tôi muốn tải xuống các trang đơn lẻ nhưng đầy đủ (bài viết, v.v.).
SiteSuuker đã được đề xuất và nó thực hiện công việc tốt cho hầu hết các trang web.
Tôi cũng thấy DeepVacuum là một công cụ đơn giản và tiện dụng với một số "cài đặt trước" hữu ích.
Ảnh chụp màn hình được đính kèm bên dưới.
-
http://epicware.com/webgrabber.html
Tôi sử dụng nó trên báo, không chắc nó có hoạt động với báo tuyết không, nhưng đáng để thử
pavuk cho đến nay là tùy chọn tốt nhất ... Đó là dòng lệnh nhưng có GUI X-Windows nếu bạn cài đặt nó từ Đĩa cài đặt hoặc tải xuống. Có lẽ ai đó có thể viết một vỏ Aqua cho nó.
pavuk thậm chí sẽ tìm thấy các liên kết trong các tệp javascript bên ngoài được tham chiếu và trỏ chúng đến phân phối cục bộ nếu bạn sử dụng các tùy chọn nhân bản -mode hoặc -mode.
Nó có sẵn thông qua dự án cổng os x, cài đặt cổng và loại
port install pavuk
Rất nhiều lựa chọn (một rừng các tùy chọn).
Tải xuống trang web A1 cho Mac
Nó có các cài đặt trước cho các tác vụ tải xuống trang web phổ biến khác nhau và nhiều tùy chọn cho những người muốn định cấu hình chi tiết. Bao gồm hỗ trợ UI + CLI.
Bắt đầu dưới dạng bản dùng thử 30 ngày sau đó được chuyển thành "chế độ miễn phí" (vẫn phù hợp với các trang web nhỏ dưới 500 trang)
Sử dụng curl, nó được cài đặt theo mặc định trong OS X. wget không, ít nhất là không phải trên máy của tôi, (Leopard).
Đánh máy:
curl http://www.thewebsite.com/ > dump.html
Sẽ tải xuống tệp, dump.html trong thư mục hiện tại của bạn
curl
không thực hiện tải xuống đệ quy (nghĩa là không thể theo siêu liên kết để tải xuống các tài nguyên được liên kết như các trang web khác). Vì vậy, bạn thực sự không thể phản chiếu toàn bộ trang web với nó.