Làm thế nào để làm việc xung quanh các tiêu đề 'sửa đổi cuối cùng' bị mất?


12

Tôi đang chạy wgetnhư thế này:

wget --mirror --adjust-extension --convert-links --no-cookies http://tshepang.net -o log-main

Tôi nhận được một loạt các tin nhắn này:

Last-modified header missing -- time-stamps turned off.

Tôi cho rằng điều đó có nghĩa là các trang tiếp tục được tải xuống lại, mặc dù tôi có chúng ở địa phương.

LƯU Ý : Tôi muốn điều này để tôi không phải tải xuống lại các tệp hiện có mỗi khi tôi chạy nhân bản lệnh.


Bạn có phải là chủ sở hữu của trang (nếu nó thực sự là tshepang.net). Nếu vậy, máy chủ web có phải là apache không và bạn có kiểm soát cấu hình của nó không? Hoặc ít nhất là .htaccess được bật với tùy chọn ghi đè cho phép?
Forcefsck

@forcefsck: Nah, trang web được điều hành bởi Posterous. Họ có một API để đọc tất cả các bài đăng, nhưng đó là một đường cong học tập cho tôi những công nghệ web này.
tshepang

Câu trả lời:


9

Bạn đã thử thêm -ctham số?

Trích từ hướng dẫn sử dụng wget:

-c - liên tục

Bắt đầu với Wget 1.7, nếu bạn sử dụng -c trên một tệp không trống và hóa ra máy chủ không hỗ trợ tiếp tục tải xuống, Wget sẽ từ chối bắt đầu tải xuống từ đầu, điều này sẽ phá hỏng nội dung hiện có một cách hiệu quả. Nếu bạn thực sự muốn tải xuống bắt đầu từ đầu, hãy xóa tệp.

Cũng bắt đầu với Wget 1.7, nếu bạn sử dụng -c trên một tệp có kích thước tương đương với tệp trên máy chủ, Wget sẽ từ chối tải xuống tệp và in một thông báo giải thích. Điều tương tự cũng xảy ra khi tệp trên máy chủ nhỏ hơn cục bộ (có lẽ vì nó đã bị thay đổi trên máy chủ kể từ lần tải xuống cuối cùng của bạn) --- vì '' tiếp tục '' không có ý nghĩa, không xảy ra tải xuống.

Ở phía bên kia của đồng xu, trong khi sử dụng -c, bất kỳ tệp nào trên máy chủ lớn hơn cục bộ sẽ được coi là tải xuống không đầy đủ và chỉ các byte "(chiều dài (từ xa) - chiều dài (cục bộ)" sẽ được tải xuống và xử lý phần cuối của tệp cục bộ. Hành vi này có thể được mong muốn trong một số trường hợp nhất định --- chẳng hạn, bạn có thể sử dụng wget -c để chỉ tải xuống phần mới được thêm vào tập tin dữ liệu hoặc tệp nhật ký.

Theo hiểu biết của tôi, nó nên bỏ qua các tệp đã được tải xuống và có cùng kích thước.


Nếu tệp nhỏ hơn thì sao?
CJ7
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.