Tôi đang làm việc với Dự án Opencl trên Xilinx FPGA. Dữ liệu đầu vào mã máy chủ không liên tục, nghĩa là; lẻ tẻ. Nếu tôi chuyển dữ liệu như nó đến; kernel sẽ bao gồm thiết lập chuyển bộ nhớ. Điều này sẽ tăng đáng kể thời gian thực hiện kernel của tôi. Nếu tôi đóng gói dữ liệu vào một mảng và chuyển dữ liệu, hạt nhân sẽ bị đình trệ trong số N chu kỳ / thời gian. Cách tốt nhất để tiếp cận vấn đề này là gì