Tôi có một PC với CPU Intel (R) Pentium (R) G640 @ 2.80 GHz và 8 GB RAM. Tôi đang chạy Science Linux 6.5 trên nó với hệ thống tập tin EXT3.
Trong thiết lập này, cách nhanh nhất tôi có thể thực hiện sort -u
trên tệp 200 gigabyte là gì?
Tôi có nên chia tệp thành các tệp nhỏ hơn (nhỏ hơn 8 GB) sort -u
, đặt chúng lại, đặt chúng lại với nhau, sau đó chia lại chúng ở một kích thước khác sort -u
, v.v.? Hoặc có bất kỳ tập lệnh sắp xếp, chương trình nào có thể xử lý các tập tin lớn này với dung lượng RAM hạn chế của tôi không?
parallel
Tôi nghĩ bạn sẽ cần GNU cho điều này hơn là các phần mềm parallel
được cài đặt theo mặc định trên một số hệ thống.
sort(1)
có thể hết không gian trên /tmp
; nếu vậy, bạn có thể chỉ định một khu vực khác cho các tệp tạm thời với biến môi trường TMPDIR
hoặc cờ-T=<tmpdir>
/tmp
.