Tôi đang sử dụng wget --mirror --html-extension --convert-links
để phản chiếu một trang web, nhưng tôi kết thúc với rất nhiều tên tệp ở định dạng post.php?id=#.html
. Khi tôi cố gắng xem những thứ này trong trình duyệt thì không thành công, vì trình duyệt bỏ qua chuỗi truy vấn khi tải tệp. Có cách nào để thay thế ?
nhân vật trong tên tập tin bằng cái gì khác không?
Câu trả lời --restrict-file-names=windows
làm việc chính xác. Kết hợp với các cờ --convert-links
và --adjust-extension
/ -E
(tên trước đây --html-extension
, cũng hoạt động nhưng không được dùng nữa), nó tạo ra một tấm gương hoạt động như mong đợi.
wget --mirror --adjust-extension --convert-links --restrict-file-names=windows http://www.example
http://site.com/article.cgi?25
sẽ được lưu nhưarticle.cgi?25.html
xem phần 2.7 tại gnu.org/software/wget/manual/wget.html#HTTP-Options