Câu trả lời:
Bạn có thể sử dụng wget và chạy một lệnh như thế này:
wget --recursive --level=1 --no-directories --no-host-directories --accept pdf http://example.com
Hoặc với các tùy chọn ngắn:
wget -r -l 1 -nd -nH -A pdf http://example.com
CẬP NHẬT: Vì bản cập nhật của bạn cho biết bạn đang chạy Windows 7: sử dụng wget cho Windows từ một cmd
dấu nhắc.
CẬP NHẬT 2: Đối với một giải pháp đồ họa - mặc dù nó có thể quá mức vì nó cũng nhận được các tệp khác là DownThem ALL
-w 5
Trong trình duyệt của bạn, nhấn CTRL+ SHIFT+ Jvà nhập
var pdflinks = []; Array.prototype.map. gọi (document.querySelector ALL ("a [href $ = \". pdf \ "]"), hàm (e, i) {if ((pdflinks | {pdflinks.push (e.href);}}); console.log (pdflinks.join (""));
Điều này sẽ trở lại trong giao diện điều khiển:
" /superuser/tagged/somepdf1.pdf " " /superuser/tagged/somepdf2.pdf " " /superuser/tagged/somepdf3.pdf "
Bây giờ sử dụng wget
với các tùy chọn dòng lệnhwget url1 url2 ...
Sao chép và dán này, mở một bàn điều khiển nhập wget
nhấn nút chuột phải để chèn nội dung clipboard của bạn và nhấn enter.
Để sử dụng tệp tải xuống, hãy nối các dòng với "\ n" và sử dụng tham số như sau wget -i mydownload.txt
Lưu ý rằng hầu hết các chương trình tải xuống (GUI) khác cũng chấp nhận được gọi với danh sách URL được phân tách bằng dấu cách.
Hi vọng điêu nay co ich. Đây là cách tôi thường làm điều đó. Nó nhanh hơn và linh hoạt hơn bất kỳ tiện ích mở rộng nào có giao diện người dùng đồ họa, tôi phải tìm hiểu và vẫn quen thuộc.
console.log('"' + pdflinks.join('" "') + '"')
- nếu không, bạn thực sự không nhận được các URL được trích dẫn
Nếu bạn muốn ở lại trình duyệt, tôi đã viết một phần mở rộng web cho chính xác mục đích này - Tôi đang làm việc để thêm khả năng lưu các tệp PDF bài viết học thuật với các tiêu đề được định dạng chính xác nhưng nếu bạn chỉ muốn tải xuống thì tất cả đều hoàn hảo cho điều này
Nó được gọi là Tab Save và trên cửa hàng Chrome trực tuyến tại đây . Bạn thậm chí không phải nhập danh sách URL nếu bạn chỉ mở tất cả chúng trong các tab (nhưng đối với số lượng lớn tệp, điều này có thể làm chậm máy tính vì vậy tôi đã thêm tùy chọn để thêm chính bạn).
Có một số công cụ Python cho phép tải xuống các liên kết PDF từ trang web dựa trên kết quả tìm kiếm của Google.
Ví dụ
google_dl
kịch bản (được khuyến nghị).
Sử dụng:
./google_dl -s http://www.example.com/ -f pdf ""
gsrchDwn
kịch bản (dựa trên kịch bản của neo ).
Sử dụng:
./gsrchDwn.py --query "site:http://www.example.com/" --ftype pdf
Lưu ý: Tôi là người duy trì cả hai tập lệnh được đề cập.
Cả hai đều đang triển khai xgoogle
thư viện Python. Cái ngã ba của thư viện này dựa trên pkrumins/xgoogle
phiên bản .
Liên quan: Một tìm kiếm trên web từ dòng lệnh Linux .