Loại trang web này cố gắng gây khó khăn khi không sử dụng trình duyệt web đồ họa, bởi vì nếu bạn sử dụng wget, bạn sẽ thiếu tất cả các quảng cáo trả tiền cho băng thông này.
Một số trang web không thực hiện kiểm tra nâng cao và có thể bị lừa dễ dàng: hãy nói với wget giả vờ rằng đó thực sự là Mozilla và nó đến từ trang tải xuống .
wget --user-agent='Mozilla/5.0 (Windows NT 6.0) Gecko/20100101 Firefox/14.0.1' \
--referer=http://downloadsite.example.com/download-page-url
http://downloadsite.example.com/download-page-url/filename.ext`
Hầu hết các trang web kiểm tra cho phép bạn thoát khỏi --user-agent=Mozilla
và --referer
đặt thành URL của tệp bạn đang tải xuống.
Với một số trang web, bạn có thể cần xuất cookie trình duyệt web và chuyển --load-cookies
sang wget; tại thời điểm này, sử dụng wget bắt đầu có nhiều công việc hơn là tải xuống thủ công. Phương pháp cuối cùng, có thể hoạt động mọi lúc nhưng yêu cầu một số mã hóa cho từng trang web, là sử dụng khung tự động hóa trình duyệt như Selenium hoặc Watir .
Xem thêm Tự động hóa các yêu cầu web bằng cách sử dụng curl?