Làm cách nào để tải xuống tất cả các trang có sẵn từ một bản phân phối?


8

Tôi đang sử dụng máy chủ CentOS và tôi muốn có một bản sao ngoại tuyến của tất cả các trang web có sẵn. Không chỉ cho các gói tôi hiện đã cài đặt, mà chỉ tất cả các trang có thể .

Ngay bây giờ, tôi không thấy một giải pháp dễ dàng cho việc này. Các trang web được gói cùng với gói cài đặt là, vì vậy tôi có nên cố gắng cài đặt mọi gói có thể có, đọc trang và gỡ gói lại không?

Có ai biết các cách khác để tải xuống tất cả các trang có sẵn cho bất kỳ phân phối cụ thể nào không?

Ps; mục tiêu là có một bản sao ngoại tuyến của các trang web có sẵn mà tôi có thể chuyển đổi sang bất kỳ định dạng nào tôi muốn (txt / html) để duyệt ngoại tuyến.


Có lẽ dễ dàng hơn để sử dụng rpm2cpiođối với từng gói và từ đó chỉ trích xuất các trang man? Thanh lịch hơn cài đặt và sau đó gỡ cài đặt.
steve

3
Vâng, tôi sẽ sử dụng yum whatprovidesđể có được một danh sách các gói có các trang trong đó, sau đó tải chúng xuống, rpm2cpiochúng, sao chép và các trang đó ra khỏi đó và sau đó xóa vòng / phút. Yêu cầu rất nhiều dung lượng lưu trữ nhưng đây không phải là một loại yêu cầu hàng ngày và tôi nghĩ rằng đây là lý tưởng gần như bạn sẽ nhận được.
Bratchley

Chào mừng bạn đến với stackexchange! Câu hỏi đầu tiên tuyệt vời!
tự đại diện

Bạn có thể nhìn vào cách các trang web trực tuyến được thiết lập. Ví dụ, tài liệu Debian tất cả các công cụ họ đã sử dụng (chúng bắt đầu từ một gói nhân bản đầy đủ).
Gilles 'SO- đừng trở nên xấu xa'

Có một cái nhìn ở đây (nó là dành cho debian): unix.stackexchange.com/questions/334171/ Kẻ
George Vasiliou

Câu trả lời:


1

Trang web này đã có thiết lập này trong một định dạng trực tuyến tuyệt vời.

Dường như có một vài lệnh tôi đã tìm kiếm được liệt kê, mặc dù tôi chắc chắn rằng nó không có mọi thứ. Lưu ý rằng sử dụng hộp tìm kiếm lên trên không phải là trải nghiệm tốt nhất, nhưng việc chọn các ký tự chữ cái ở phía dưới hoạt động rất tốt.

bảng chữ cái

Chúng cũng được nhóm theo các phần (ví dụ: Lệnh người dùng, Cuộc gọi hệ thống, Trò chơi, v.v.) tạo nên một cách thú vị để tìm các công cụ mới.

Bạn chỉ có thể sử dụng trang web đó như là hoặc làm một cái gì đó như:

  • Sử dụng một trình duyệt web như. HTTrack tuyệt vời (GPL và cũng được bao gồm trong bản phân phối Kali Linux)
  • Viết các tập lệnh của riêng bạn với một cái gì đó như Python / urllib / BeautifulSoup để xử lý và định dạng như bạn muốn.

Tôi biết bài này đã cũ, nhưng có lẽ ai đó sẽ vấp phải nó như tôi đã làm.

Thưởng thức!


0

Nếu máy chủ của bạn không dùng một lần, có thể không nên cài đặt số lượng lớn gói phần mềm trên đó, ngay cả khi bạn có ý định xóa chúng sau đó. Thay vào đó, tôi khuyên bạn nên cài đặt Vagrant và VirtualBox (trên bất kỳ hệ thống nào, Windows, Mac, Linux) và tạo hộp CentOS Vagrant để hoạt động.

Sau đó, trên hộp vagrant, bạn có thể cài đặt tất cả các gói phần mềm có thể, và sau đó tìm các tệp trang man trực tiếp trên đĩa cứng ảo, tarchúng lên vàscp chúng vào máy chủ CentOS của bạn.

Tôi sẽ lưu ý rằng tôi nghi ngờ sẽ có một cách hoàn hảo để thực hiện điều này, bởi vì ngay cả khi có một quy ước, theo đó các trang man là các gói cùng với gói phần mềm để cho phép cài đặt riêng và ngay cả khi có yumlệnh tích hợp để cài đặt tất cả các gói phần mềm trang man có sẵn, vẫn sẽ có vấn đề tuân thủ các thực tiễn tốt nhất. Bắt tất cả các nhà cung cấp phần mềm cho toàn bộ phân phối tuân thủ các thực tiễn tốt nhất sẽ không có nghĩa là kỳ công.


Nhân tiện, nếu bạn quản lý được điều này, tôi rất thích xem một mô tả chi tiết hơn về cách bạn làm điều đó. Tôi sẽ không nhớ tất cả các trang người đàn ông cài đặt bản thân mình.
tự đại diện
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.