Tôi đang cố tải xuống hai trang web để đưa vào CD:
http://boinc.berkeley.edu/trac/wiki
http://www.boinc-wiki.info
Vấn đề tôi gặp phải là cả hai đều là wiki. Vì vậy, khi tải xuống với ví dụ:
wget -r -k -np -nv -R jpg,jpeg,gif,png,tif http://www.boinc-wiki.info/
Tôi nhận được rất nhiều tệp vì nó cũng theo các liên kết như ...? Action = chỉnh sửa ...? Action = diff & version = ...
Có ai biết một cách để khắc phục điều này?
Tôi chỉ muốn các trang hiện tại, không có hình ảnh và không có khác biệt, v.v.
Tái bút
wget -r -k -np -nv -l 1 -R jpg,jpeg,png,gif,tif,pdf,ppt http://boinc.berkeley.edu/trac/wiki/TitleIndex
Điều này làm việc cho ber ở nhưng boinc-wiki.info vẫn gây rắc rối cho tôi: /
PPS:
Tôi đã nhận được những gì dường như là các trang có liên quan nhất với:
wget -r -k -nv -l 2 -R jpg,jpeg,png,gif,tif,pdf,ppt http://www.boinc-wiki.info