Tôi quan sát thấy tốc độ truyền dữ liệu tăng lên đáng kể khi tôi sử dụng bộ nhớ được ghim để truyền dữ liệu CUDA. Trên linux, lệnh gọi hệ thống cơ bản để đạt được điều này là mlock. Từ trang chủ của mlock, nó tuyên bố rằng việc khóa trang sẽ ngăn nó bị hoán đổi:
mlock () khóa các trang trong phạm vi địa chỉ bắt đầu từ addr và tiếp tục cho các byte len. Tất cả các trang có chứa một phần của dải địa chỉ được chỉ định được đảm bảo nằm trong RAM khi cuộc gọi trả về thành công;
Trong các thử nghiệm của tôi, tôi có một vài hợp đồng bộ nhớ trống trên hệ thống của mình nên không bao giờ có nguy cơ các trang bộ nhớ có thể bị hoán đổi nhưng tôi vẫn quan sát thấy tốc độ tăng tốc. Bất cứ ai có thể giải thích những gì thực sự đang xảy ra ở đây ?, bất kỳ thông tin chi tiết hoặc thông tin được đánh giá cao.