Tôi có một ứng dụng có thể song song hóa tầm thường nhưng hiệu năng của nó bị giới hạn ở mức I / O lớn. Ứng dụng đọc một mảng đầu vào duy nhất được lưu trữ trong một tệp có kích thước thường là 2-5 GB (nhưng tôi hy vọng con số này sẽ tăng lên trong tương lai). Một tính toán điển hình áp dụng cùng một hoạt động cho mỗi hàng hoặc cột của mảng đó. Đối với các hoạt động nặng CPU, tôi có khả năng mở rộng rất tốt lên tới khoảng 100 bộ xử lý, nhưng đối với các hoạt động chậm hơn I / O và giao tiếp liên quan (truy cập NFS) chiếm ưu thế và tôi không thể sử dụng hiệu quả hơn một vài bộ xử lý.
Các tùy chọn hiệu quả và di động (lý tưởng là hiệu quả di động) cho tình huống như vậy là gì? Song song HDF5 có vẻ đầy hứa hẹn. Có ai có kinh nghiệm thực tế với nó?
MPI-I / O có phải là thứ đáng để xem xét không? Nó có thể hoạt động hiệu quả với một bố cục tệp nhất định hay tôi phải điều chỉnh mọi thứ?