Mô hình song song lý thuyết nào gần nhất với mô hình lập trình CUDA / OpenCL?
Ví dụ, nó phù hợp ở một mức độ nào đó với mô hình Máy truy cập ngẫu nhiên song song (PRAM) chung. Tuy nhiên, đó là quá chung chung, vì nó làm cho sự trừu tượng của các độ trễ truy cập bộ nhớ khác nhau và các vấn đề đồng bộ hóa.
Câu hỏi của tôi là mô hình lý thuyết nào mà kiến trúc CUDA phù hợp nhất (có trong tâm trí sự song song phân cấp của các luồng và các khối của các luồng hợp tác)?