Mô hình song song lý thuyết nào gần với CUDA nhất?

8

Mô hình song song lý thuyết nào gần nhất với mô hình lập trình CUDA / OpenCL?

Ví dụ, nó phù hợp ở một mức độ nào đó với mô hình Máy truy cập ngẫu nhiên song song (PRAM) chung. Tuy nhiên, đó là quá chung chung, vì nó làm cho sự trừu tượng của các độ trễ truy cập bộ nhớ khác nhau và các vấn đề đồng bộ hóa.

Câu hỏi của tôi là mô hình lý thuyết nào mà kiến trúc CUDA phù hợp nhất (có trong tâm trí sự song song phân cấp của các luồng và các khối của các luồng hợp tác)?

parallel-computing machine-models

— isti_spl
nguồn

6

Theo hiểu biết tốt nhất của tôi, nó có thể là mô hình Bộ nhớ chia sẻ hàng đợi (QSM) , mặc dù tính song song phân cấp của các luồng không được tính đến. Tuy nhiên, việc truy cập vào bộ nhớ cục bộ và bộ nhớ chung (băng thông khác nhau) và đồng bộ hàng loạt (trong đó các luồng có thể hoạt động không đồng bộ giữa các đồng bộ hóa rào cản) được xem xét.

— Quán cà phê Massimo
nguồn

1

Vì tất cả các SM thực hiện cùng một hướng dẫn từ hạt nhân CUDA theo từng bước, tôi sẽ nói đó là SIMD cũ đơn giản.

— người dùng2251346
nguồn

Chà, SM khác nhau có thể thực hiện các hướng dẫn khác nhau, phải không? Trong một SM duy nhất, tất cả các luồng trong một sợi dọc thực hiện cùng một lệnh ... nhưng ngay cả các sợi dọc khác nhau trong cùng một khối có thể phân kỳ mà không bị phạt. Điều đó nói rằng, SIMD cũng sẽ là câu trả lời của tôi, mặc dù ở mức độ chi tiết của sợi dọc, không phải SM hay thậm chí là khối.

— Patrick87

Tìm thấy điều này ngày hôm nay đọc trong thực thi GPU dựa trên nhiều luồng đơn (SIMT) được trích dẫn từ J. Nickolls, I. Buck, M. Garland và K. Skadron, Lập trình song song có thể mở rộng với CUDA, Queue 6, 2 ( Tháng 3 năm 2008), 40-53

— dùng2251346