Tôi đã chạy mã động lực phân tử (MD) GROMACS trên cụm Ubuntu Linux bao gồm các nút chứa 24 CPU Intel Xeon. Điểm quan tâm đặc biệt của tôi hóa ra hơi nhạy cảm với độ chính xác số học dấu phẩy động, vì vậy tôi đã phải chạy GROMACS với độ chính xác gấp đôi thay vì độ chính xác đơn - mặc dù chi phí tính toán cao hơn gấp đôi. Vì vậy, trên cụm, tôi đã biên dịch GROMACS với độ chính xác gấp đôi.
Tôi đang xem xét việc mua một số GPU, vì có thể có một người thân tăng tốc ("tăng tốc GPU") cho CPU. Tuy nhiên, tôi cần một GPU cho phép tôi thực hiện số học chính xác gấp đôi. Bạn có biết nếu phần cứng như vậy là có sẵn trên thị trường? Một bài đăng gần đây trên danh sách gửi thư GROMACS cho thấy GPU chính xác gấp đôi không có sẵn trên thị trường:
Phần cứng không hỗ trợ nó [số học chính xác kép] nhưng AFAIK.
Đây trang Wikipedia dường như cho thấy GPU độ chính xác kép không phổ biến vì chúng có thể không hiệu quả:
Việc triển khai điểm nổi trên GPU Nvidia chủ yếu tuân thủ theo chuẩn IEEE; tuy nhiên, điều này không đúng với tất cả các nhà cung cấp. Điều này có ý nghĩa cho tính đúng đắn được coi là quan trọng đối với một số ứng dụng khoa học. Mặc dù các giá trị dấu phẩy động 64 bit (độ chính xác kép) thường có sẵn trên CPU, nhưng các giá trị này không được hỗ trợ phổ biến trên GPU; một số kiến trúc GPU hy sinh sự tuân thủ của IEEE trong khi một số khác lại thiếu độ chính xác kép. Đã có những nỗ lực mô phỏng các giá trị dấu phẩy động chính xác kép trên GPU; tuy nhiên, sự đánh đổi tốc độ phủ nhận bất kỳ lợi ích nào khi giảm tải tính toán lên GPU ngay từ đầu.
Đây trang NVIDIA Tesla , trong tham khảo "Đỉnh độ chính xác gấp đôi hiệu suất điểm nổi" trong bảng xếp hạng, dường như gợi ý rằng các tính toán chính xác gấp đôi có thể , trên thực tế, được thực hiện trên GPU của họ (mặc dù với chi phí tính toán cao hơn).
Vậy, tôi nên tin cái gì? Bạn có bất kỳ kinh nghiệm về vấn đề này?