Tôi đã phát triển một giải pháp hoạt động của Phương pháp phần tử hữu hạn để giải quyết các vấn đề truyền nhiệt bằng cách sử dụng GPU và OpenCL bằng phương pháp Conjugate Gradient. Nhược điểm chính của phương pháp này là nhu cầu cao về bộ nhớ. Hơn nữa, trong trường hợp bộ nhớ card đồ họa thường rất hạn chế. Tôi thấy hai lựa chọn:
- Tạo tên miền phụ và trao đổi các phần của lưới với bộ nhớ máy chủ
- Sử dụng phương pháp nhiều mặt
Tôi phải tính đến kiến trúc cụ thể. Trao đổi có thể rất tốn kém. Phương pháp CG rất phổ biến trong bối cảnh tính toán GPGPU nhưng tôi không thể tìm thấy bất kỳ so sánh nào giữa phương pháp CG và đa phương thức (trong trường hợp GPGPU). Phương pháp nhiều mặt có thể nhanh hơn CG không? Đây là một câu hỏi chung, trên thực tế, nó vẫn phụ thuộc vào việc thực hiện.