Tôi có khoảng 200 GB dữ liệu nhật ký được tạo hàng ngày, được phân phối trong khoảng 150 tệp nhật ký khác nhau.
Tôi có một tập lệnh di chuyển các tập tin đến một vị trí tạm thời và thực hiện tar-bz2 trên thư mục tạm thời.
Tôi nhận được kết quả tốt khi nhật ký 200 GB được nén xuống còn khoảng 12-15 GB.
Vấn đề là phải mất mãi mãi để nén các tập tin. Các cron công việc chạy tại 02:30 hàng ngày và tiếp tục chạy cho đến 5: 00-6: 00 PM.
Có cách nào để cải thiện tốc độ nén và hoàn thành công việc nhanh hơn không? Có ý kiến gì không?
Đừng lo lắng về các quy trình khác và tất cả, vị trí nén xảy ra là trên một NAS và tôi có thể chạy gắn kết NAS trên một máy ảo chuyên dụng và chạy tập lệnh nén từ đó.
Đây là đầu ra của đầu để tham khảo:
top - 15:53:50 up 1093 days, 6:36, 1 user, load average: 1.00, 1.05, 1.07
Tasks: 101 total, 3 running, 98 sleeping, 0 stopped, 0 zombie
Cpu(s): 25.1%us, 0.7%sy, 0.0%ni, 74.1%id, 0.0%wa, 0.0%hi, 0.1%si, 0.1%st
Mem: 8388608k total, 8334844k used, 53764k free, 9800k buffers
Swap: 12550136k total, 488k used, 12549648k free, 4936168k cached
PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND
7086 appmon 18 0 13256 7880 440 R 96.7 0.1 791:16.83 bzip2
7085 appmon 18 0 19452 1148 856 S 0.0 0.0 1:45.41 tar cjvf /nwk_storelogs/compressed_logs/compressed_logs_2016_30_04.tar.bz2 /nwk_storelogs/temp/ASPEN-GC-32459:nkp-aspn-1014.log /nwk_stor
30756 appmon 15 0 85952 1944 1000 S 0.0 0.0 0:00.00 sshd: appmon@pts/0
30757 appmon 15 0 64884 1816 1032 S 0.0 0.0 0:00.01 -tcsh
tar.bz2
tệp không?
top
Đầu ra của bạn cho thấy bzip2
quy trình xử lý đơn luồng của bạn đạt tối đa một lõi, nhưng bạn đang chạy nó trên hệ thống lõi tứ (Một quy trình sử dụng CPU 100% -> 25.1%
thời gian CPU không gian người dùng, 74% không hoạt động). Vì vậy, với những thay đổi nhỏ, bạn có thể tăng gấp 4 lần, trừ khi điều gì đó khác trở thành nút cổ chai. Đọc Gilles trả lời cẩn thận. Cân nhắc sử dụng CPU trong cùng hộp với các đĩa chứa dữ liệu để thực hiện nén. (Bạn thậm chí có thể nén một số tệp của mình trên một hộp, các tệp khác và lưu trữ sau đó, vì vậy cả hai CPU đều được sử dụng.)