Nhện web cho Ubuntu


11

Tôi đang tìm một con nhện web cho Ubuntu như một Webripper này - Phần mềm Calluna . Bạn có thể tải xuống toàn bộ trang web như bạn có thể với

wget -r -m example.com

nhưng tính năng tôi đang tìm kiếm là bạn có thể nhập cụm từ tìm kiếm như "Linux" và nó tìm kiếm trên Web và tải chúng xuống. Có chương trình nào trên Ubuntu như thế này không?

Câu trả lời:


4

Bạn có thể sử dụng Google Alerts để tạo một loại trang tìm kiếm được gửi đến nguồn cấp dữ liệu và sau đó sử dụng trình đọc RSS hoặc Thunderbird để đọc chúng.

Tôi sử dụng Thunderbird cho RSS. Tôi không biết nếu có bất kỳ trình đọc RSS nào có thể xuất nguồn cấp dữ liệu sang html đơn giản.



3

Bạn có thể thử http ripper .

Dưới đây là một số tính năng được đăng trên trang web:

Free Software (GPL 3)
Generic (works with almost every website)
Runs on GNU/Linux and Windows
Nearly undetectable / blockable by servers
Built with python and pygtk

http://29a.ch/httpripper/sc Greensshots/2.png Ảnh chụp màn hình

Xem hướng dẫn, từ chính nhà phát triển của Olepripper:

Liên kết tải xuống:

Nó hoạt động với tôi theo Ubuntu 11.10 x64


-1

Có các mô-đun đầy đủ tại CPAN của Perl. Bạn chỉ cần một chút kịch bản perl.

Cụ thể, hãy xem mô-đun WWW: Cơ giới hóa tại mô-đun WWW: Cơ giới hóa .

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.