Vâng, các GPU là tuyệt vời để thực hiện những thứ song song ồ ạt. Nhiều người đã đặt 8 CPU trở lên trên một GPU - nó không chỉ đơn thuần là "về nguyên tắc".
Kiểm tra hình ảnh sơ đồ tầng trong bài viết
"Hệ thống 24 bộ xử lý trên thiết kế chip chip với mạng trên chip"
của Zhoukun WANG và Omar HAMMAMI.
Sơ đồ tầng đó làm cho khá rõ ràng rằng đồ họa cụ thể đó có khá nhiều thứ. 24 lõi CPU - mỗi lõi là một CPU MicroBlaze 32 bit với tổng số bộ nhớ dữ liệu và hướng dẫn cục bộ 32 KByte - chiếm khoảng một nửa số FPGA (xung quanh chu vi). Việc định tuyến giữa các lõi CPU và 4 bus ngoài độc lập sẽ lấp đầy tất cả các phần còn lại của FPGA. (Các bus ngoài có mỗi bit 64 bit dữ liệu cộng với một số tín hiệu điều khiển, mỗi tín hiệu dẫn đến một mô-đun bộ nhớ DDR2 độc lập).
(IC đặc biệt này cũng bao gồm hai lõi cứng CPU PowerPC 405 ngoài cấu trúc đồ họa - Zhoukun và Omar dường như không bận tâm sử dụng chúng).
Như những người khác ở đây đã chỉ ra, việc chia "số lượng cổng trong một đồ họa" cho "số lượng cổng trong CPU" là quá lạc quan. Trong trường hợp này, 142.128 LUT trên Xilinx FPGA Virtex-4 FX140 chia cho khoảng 1000 LUT cần thiết cho một MicroBlaze kích thước tối thiểu cung cấp (tối ưu) 142 CPU cho mỗi chip. Vì vậy, bạn có thất vọng khi rõ ràng "chỉ" 24 CPU phù hợp với kết cấu đồ họa đó (không tính hai lõi cứng PowerPC 405 bên ngoài kết cấu đồ họa trên IC đó) không?
Một GPU cổng 1 triệu chia cho CPU cổng 50 nghìn cho (tối ưu) 20 CPU cho mỗi chip. Tôi nghĩ rằng bạn sẽ may mắn khi ép được thậm chí 4 CPU vào đồ họa đó.
"Thật đáng kinh ngạc những gì bạn có thể siết chặt vào các bộ phận này nếu bạn thiết kế kiến trúc máy một cách cẩn thận để khai thác tài nguyên FPGA. Ngược lại, có một bài viết rất thú vị trên tờ EE Times gần đây của một đồng nghiệp từ VAutomation thực hiện ảo 6502 trong VHDL, sau đó tổng hợp Mặc dù vậy, thiết kế 6502 chỉ sử dụng khoảng 4000 "cổng ASIC" nhưng nó không phù hợp với XC4010, một cái gọi là "Cổng 10.000". RISC 32 bit có hai vấn đề phải phù hợp và 4 MHz 6502 thì không, nói rất nhiều về tổng hợp VHDL so với vị trí thủ công, về kiến trúc kế thừa so với tùy chỉnh và thậm chí có thể là một cái gì đó về CISC so với RISC ... "- Jan Gray
Bài viết trên Wikipedia: "bộ xử lý mềm" có nhiều thông tin hơn về việc đóng gói nhiều CPU trên một đồ họa đơn.