Tôi đang xem xét tăng tốc các sản phẩm vector ma trận nhưng mọi thứ tôi đọc là về cách thực hiện nó cho các ma trận rất lớn. Trường hợp của tôi, ma trận là nhỏ nhưng số lần nó phải được thực hiện là rất lớn.
Những phương pháp nào, nếu có, để tối ưu hóa điều này? Có thể nhanh hơn để xây dựng một ma trận khối đường chéo thực sự lớn ra khỏi các ma trận nhỏ và một vectơ lớn được tạo từ các vectơ nhỏ hơn và sử dụng các kỹ thuật cho việc tăng tốc vectơ ma trận lớn? Hoặc sẽ thiết lập ma trận toàn cầu và vectơ giết chết bất kỳ lợi ích nào ở đó?