Làm cách nào tôi có thể tải xuống tất cả các trang từ một trang web?
Bất kỳ nền tảng là tốt.
Làm cách nào tôi có thể tải xuống tất cả các trang từ một trang web?
Bất kỳ nền tảng là tốt.
Câu trả lời:
HTTRACK hoạt động giống như một nhà vô địch để sao chép nội dung của toàn bộ trang web. Công cụ này thậm chí có thể lấy các phần cần thiết để làm cho một trang web có nội dung mã hoạt động ngoại tuyến. Tôi ngạc nhiên về những thứ nó có thể sao chép ngoại tuyến.
Chương trình này sẽ làm tất cả những gì bạn yêu cầu.
Đi săn vui nhé!
Wget là một công cụ dòng lệnh cổ điển cho loại nhiệm vụ này. Nó đi kèm với hầu hết các hệ thống Unix / Linux và bạn cũng có thể tải nó cho Windows . Trên máy Mac, Homebrew là cách dễ nhất để cài đặt nó ( brew install wget
).
Bạn sẽ làm một cái gì đó như:
wget -r --no-parent http://site.com/songs/
Để biết thêm chi tiết, xem Hướng dẫn sử dụng Wget và các ví dụ của nó , hoặc ví dụ:
Sử dụng wget:
wget -m -p -E -k www.example.com
Các tùy chọn giải thích:
-m, --mirror Turns on recursion and time-stamping, sets infinite
recursion depth, and keeps FTP directory listings.
-p, --page-requisites Get all images, etc. needed to display HTML page.
-E, --adjust-extension Save HTML/CSS files with .html/.css extensions.
-k, --convert-links Make links in downloaded HTML point to local files.
--mirror
là rất tự giải thích. Đây là từ trang man: " Tùy chọn này bật đệ quy và dập thời gian, đặt độ sâu đệ quy vô hạn và giữ danh sách thư mục FTP. Hiện tại nó tương đương với -r -N - l inf --no-remove-list ")
wget --mirror -p --html-extension --convert-links www.example.com
và nó chỉ tải về chỉ mục. Tôi nghĩ bạn cần -r
tải xuống toàn bộ trang web.
-w seconds
(để chờ một số bí mật giữa các yêu cầu hoặc --limit-rate=amount
để chỉ định băng thông tối đa sẽ sử dụng trong khi tải xuống
Bạn nên xem ScrapBook , một phần mở rộng của Firefox. Nó có một chế độ chụp sâu .
Internet Download Manager có tiện ích Site Grabber với rất nhiều tùy chọn - cho phép bạn tải xuống hoàn toàn bất kỳ trang web nào bạn muốn, theo cách bạn muốn.
Bạn có thể đặt giới hạn về kích thước của các trang / tệp để tải xuống
Bạn có thể đặt số lượng trang web chi nhánh sẽ truy cập
Bạn có thể thay đổi cách hành xử của tập lệnh / cửa sổ bật lên / trùng lặp
Bạn có thể chỉ định một tên miền, chỉ trong miền đó, tất cả các trang / tệp đáp ứng các cài đặt được yêu cầu sẽ được tải xuống
Các liên kết có thể được chuyển đổi thành liên kết ngoại tuyến để duyệt
Bạn có các mẫu cho phép bạn chọn các cài đặt ở trên cho bạn
Tuy nhiên, phần mềm không miễn phí - xem nó có phù hợp với nhu cầu của bạn không, hãy sử dụng phiên bản đánh giá.
Tôi sẽ giải quyết bộ đệm trực tuyến mà trình duyệt sử dụng ...
Thông thường, hầu hết các trình duyệt sử dụng bộ đệm duyệt để giữ các tệp bạn tải xuống từ một trang web xung quanh một chút để bạn không phải tải xuống hình ảnh tĩnh và nội dung nhiều lần. Điều này có thể tăng tốc mọi thứ khá một chút trong một số trường hợp. Nói chung, hầu hết các bộ đệm của trình duyệt được giới hạn ở một kích thước cố định và khi đạt đến giới hạn đó, nó sẽ xóa các tệp cũ nhất trong bộ đệm.
Các ISP có xu hướng có các máy chủ bộ đệm lưu giữ các bản sao của các trang web thường truy cập như ESPN và CNN. Điều này tiết kiệm cho họ những rắc rối khi truy cập các trang web này mỗi khi có ai đó trên mạng của họ đến đó. Điều này có thể tiết kiệm đáng kể số lượng yêu cầu trùng lặp với các trang web bên ngoài cho ISP.
Tôi thích Explorer ngoại tuyến .
Đây là một phần mềm chia sẻ, nhưng nó rất tốt và dễ sử dụng.
Tôi đã không làm điều này trong nhiều năm, nhưng vẫn còn một vài tiện ích ngoài kia. Bạn có thể muốn thử Web Snake . Tôi tin rằng tôi đã sử dụng nó nhiều năm trước. Tôi nhớ tên ngay khi tôi đọc câu hỏi của bạn.
Tôi đồng ý với Stecy. Xin đừng ham trang web của họ. Rất tệ.
Hãy dùng thử BackStreet Browser .
Nó là một trình duyệt ngoại tuyến miễn phí, mạnh mẽ. Một chương trình tải về và xem trang web đa luồng, tốc độ cao. Bằng cách thực hiện nhiều yêu cầu máy chủ đồng thời, BackStreet Browser có thể nhanh chóng tải xuống toàn bộ trang web hoặc một phần của trang web bao gồm HTML, đồ họa, Java Applet, âm thanh và các tệp có thể xác định người dùng khác và lưu tất cả các tệp trong ổ cứng của bạn, ở định dạng gốc của chúng, hoặc dưới dạng tệp ZIP nén và xem ngoại tuyến.
Teleport Pro là một giải pháp miễn phí khác sẽ sao chép bất kỳ và tất cả các tệp từ bất kỳ mục tiêu nào của bạn (cũng có phiên bản trả phí cho phép bạn lấy thêm nhiều trang nội dung).
DownThemAll là một tiện ích bổ sung của Firefox sẽ tải xuống tất cả nội dung (ví dụ: tệp âm thanh hoặc video) cho một trang web cụ thể chỉ bằng một cú nhấp chuột. Điều này không tải xuống toàn bộ trang web, nhưng đây có thể là điều mà câu hỏi đang tìm kiếm.
Đối với Linux và OS X: Tôi đã viết trang web lấy để lưu trữ toàn bộ trang web vào các tệp WARC . Các tệp WARC này có thể được duyệt hoặc trích xuất. Grab-site cho phép bạn kiểm soát các URL nào sẽ bỏ qua bằng cách sử dụng các biểu thức thông thường và chúng có thể được thay đổi khi thu thập thông tin đang chạy. Nó cũng đi kèm với một bộ mặc định rộng rãi để bỏ qua các URL rác.
Có một bảng điều khiển web để theo dõi thu thập thông tin, cũng như các tùy chọn bổ sung để bỏ qua nội dung video hoặc phản hồi trên một kích thước nhất định.
Trong khi wget đã được đề cập đến tài nguyên này và dòng lệnh rất liền mạch, tôi nghĩ rằng nó xứng đáng được đề cập:
wget -P /path/to/destination/directory/ -mpck --user-agent="" -e robots=off --wait 1 -E https://www.example.com/
FreeDoadManager.org đáng kính cũng có tính năng này.
Trình quản lý tải xuống miễn phí có hai dạng ở hai dạng: Site Explorer và Site Spider :
Site Explorer
Site Explorer cho phép bạn xem cấu trúc thư mục của một trang web và dễ dàng tải xuống các tệp hoặc thư mục cần thiết.
HTML Spider
Bạn có thể tải xuống toàn bộ trang web hoặc thậm chí toàn bộ trang web với HTML Spider. Công cụ có thể được điều chỉnh để tải xuống các tệp chỉ có phần mở rộng được chỉ định.
Tôi thấy Site Explorer rất hữu ích để xem những thư mục nào cần bao gồm / loại trừ trước khi bạn cố tải xuống toàn bộ trang - đặc biệt là khi có toàn bộ diễn đàn ẩn trong trang mà bạn không muốn tải xuống chẳng hạn.
tải xuống HTTracker nó sẽ tải xuống các trang web rất dễ dàng để làm theo.
liên kết tải xuống: http://www.httrack.com/page/2/
video có thể giúp bạn: https://www.youtube.com/watch?v=7IHIGf6lcL4
Tôi tin rằng google chrome có thể làm điều này trên các thiết bị máy tính để bàn, chỉ cần vào menu trình duyệt và nhấp vào lưu trang web.
Cũng lưu ý rằng các dịch vụ như túi có thể không thực sự lưu trang web và do đó dễ bị thối liên kết.
Cuối cùng lưu ý rằng sao chép nội dung của một trang web có thể vi phạm bản quyền, nếu nó được áp dụng.