Tôi đang cố tải xuống dữ liệu trị giá một năm từ Máy chủ FTP của NOAA bằng wget (hoặc ncftpget). Tuy nhiên, nó mất nhiều thời gian hơn so với chi phí do FTP (tôi nghĩ). Ví dụ, lệnh này
time wget -nv -m ftp://ftp:email@ftp.ncdc.noaa.gov/pub/data/noaa/2015 -O /weather/noaa/2015
Hoặc tương tự, thông qua ncftpget
ncftpget -R -T -v ftp.ncdc.noaa.gov /weather/noaa/ /pub/data/noaa/2015
Mang lại một kết quả của. 53 phút để chuyển 30M!
FINISHED --2015-01-03 16:21:41--
Total wall clock time: 53m 32s
Downloaded: 12615 files, 30M in 7m 8s (72.6 KB/s)
real 53m32.447s
user 0m2.858s
sys 0m8.744s
Khi tôi xem chuyển khoản này, mỗi tệp riêng lẻ chuyển khá nhanh (500kb / giây) nhưng quá trình tải xuống 12.000 tệp tương đối nhỏ phải chịu một lượng chi phí khổng lồ và làm chậm toàn bộ quá trình.
Những câu hỏi của tôi:
- Tôi có đang đánh giá chính xác tình hình không? Tôi nhận ra rằng thật khó để nói mà không biết các máy chủ nhưng FTP có thực sự hấp dẫn điều này khi chuyển hàng tấn tệp nhỏ không?
- Có bất kỳ tinh chỉnh nào để wget hoặc ncftpget để cho phép họ chơi đẹp hơn với máy chủ FTP từ xa không? Hoặc có lẽ một số loại song song?