Phản hồi này có thể là quá muộn, nhưng dù sao cũng đáng lưu ý. GPU Ocelot ( trong đó tôi là một trong những người đóng góp cốt lõi ) có thể được biên dịch mà không cần cài đặt trình điều khiển thiết bị CUDA (libcuda.so) nếu bạn muốn sử dụng Trình mô phỏng hoặc phụ trợ LLVM. Tôi đã trình diễn trình giả lập trên các hệ thống không có GPU NVIDIA.
Trình giả lập cố gắng triển khai trung thực các thông số kỹ thuật PTX 1.4 và PTX 2.1 có thể bao gồm các tính năng mà GPU cũ hơn không hỗ trợ. Trình biên dịch LLVM cố gắng dịch chính xác và hiệu quả từ PTX sang x86, hy vọng sẽ làm cho CUDA trở thành một cách hiệu quả để lập trình CPU đa lõi cũng như GPU. -deviceemu
đã không còn là một tính năng của CUDA trong một thời gian khá dài, nhưng trình dịch LLVM luôn nhanh hơn.
Ngoài ra, một số công cụ kiểm tra độ đúng được tích hợp trong trình giả lập để xác minh: các truy cập bộ nhớ được căn chỉnh, các truy cập vào bộ nhớ dùng chung được đồng bộ hóa đúng cách và truy cập hội nghị bộ nhớ toàn cầu truy cập các vùng bộ nhớ được cấp phát. Chúng tôi cũng đã triển khai một trình gỡ lỗi tương tác dòng lệnh lấy cảm hứng chủ yếu từ gdb để thực hiện một bước thông qua nhân CUDA, thiết lập các điểm ngắt và điểm giám sát, v.v. bạn có thể thấy chúng hữu ích.
Xin lỗi về khía cạnh chỉ dành cho Linux. Chúng tôi đã bắt đầu một chi nhánh Windows ( cũng như một cổng Mac OS X ) nhưng gánh nặng kỹ thuật đã đủ lớn để gây căng thẳng cho việc theo đuổi nghiên cứu của chúng tôi. Nếu bất kỳ ai có thời gian và quan tâm, họ có thể muốn giúp chúng tôi cung cấp hỗ trợ cho Windows!
Hi vọng điêu nay co ich.