Làm cách nào để tự động cập nhật bản sao trang web có ngoại lệ cho một số trang nhất định?


1

Tôi hiện đang phản chiếu một trang web trên máy chủ của tôi. Bản thân trang web hiếm khi được cập nhật, nhưng nó được cập nhật đủ để thông tin có thể trở nên lỗi thời một cách nhanh chóng.

Tôi đã nhân đôi nó đầu tiên với wget, và điều này hoạt động tốt, nhưng tôi đã thực hiện một số thay đổi:

  • Index.html gốc được sử dụng, nhưng trang web cũng cung cấp main.html về cơ bản là index.html nhưng không có khung. Tôi đã xóa index.html và đổi tên thành main.html.
  • Tôi không muốn phản chiếu webchat, blog hoặc diễn đàn, vì vậy tôi đã xóa các tệp và thư mục đó và tạo các thư mục "blog" "forum" và "chat" và đặt chuyển hướng php trong mỗi trang đó, chuyển hướng khách truy cập đến trang web gốc.

Tôi muốn tự động cập nhật máy nhân bản (có thể cứ sau 24-72 giờ một lần), nhưng bảo toàn những thay đổi tôi đã thực hiện. Điều này có thể không? Làm thế nào tôi sẽ làm về nó? Tôi hoàn toàn không biết làm thế nào.

Cảm ơn vì tất cả sự giúp đỡ! :)

Câu trả lời:


0

Tôi giả sử bạn đang sử dụng wget --miror. Phương pháp khả thi:

  1. Nếu các phần được bảo quản trong thư mục, điều này có thể hoạt động:

    wget --exclude-directories=LIST

  2. Nếu bạn có thể chịu đựng được điều đó, bạn cho phép điều kiện cuộc đua, bạn có thể để ww ghi đè lên mọi thứ và sau đó ghi đè lại chúng bằng một tập lệnh khôi phục chúng.

  3. Ngăn chặn ghi đè các tệp bạn không muốn thay đổi.

    chmod 444 index.html

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.