Dù bạn làm gì, tính toán trạng thái tiếp theo cho một máy tự động di động yêu cầu nhiều tính toán hơn so với các tế bào trong máy tự động. Do đó, để có được thời gian liên tục, bạn cần nhiều lõi máy tính như có các ô.
Số lượng các GPU này hiện tại nhiều nhất là vài nghìn, trong khi việc tính toán trạng thái tiếp theo đơn giản đến mức tôi mong đợi kết quả bị ràng buộc IO, tức là bạn có thể có được xấp xỉ rất tốt thời gian cần thiết chỉ bằng cách xem xét di chuyển dữ liệu cần thiết (và nếu đó không phải là một xấp xỉ tốt, thì việc triển khai có hiệu quả hoặc kiến trúc không phù hợp, nhưng điều đó sẽ rất đáng ngạc nhiên).
Đối với FPGA, câu hỏi khó hơn và có thể sẽ phụ thuộc vào sự pha trộn giữa các đơn vị bộ nhớ và tính toán có sẵn. Nếu tôi không ở quá xa, bạn sẽ không có đủ bộ nhớ để giữ cho tất cả các đơn vị bận rộn và nếu bạn dựa vào bộ nhớ ngoài, bạn ở cùng chỗ với GPU, băng thông bộ nhớ sẽ là yếu tố hạn chế và tôi sẽ không ngạc nhiên nếu kết luận là không có lợi thế so với GPU. (Lưu ý rằng trong khi tôi đã làm việc với FPGA, cách đây nhiều năm, giờ đây có thể có các mô hình FPGA với sự pha trộn phù hợp).
ASIC cung cấp linh hoạt hơn. Bạn có thể dễ dàng thực hiện như tâm thu (nhưng với luồng dữ liệu hai chiều, một số tâm thu thường bị giới hạn ở luồng dữ liệu một chiều), mỗi ô vật lý là một logic: bit bộ nhớ và logic cần thiết để tính toán trạng thái tiếp theo của nó và được đặt ra Vì vậy, đó là hàng xóm vật lý của nó là hợp lý. Bạn rõ ràng là trong cõi thời gian liên tục. Tùy thuộc vào loại macro cứng nào bạn có, bạn có thể tốt hơn một chút rõ ràng hơn và có các ô vật lý tập hợp lại một số logic. Mục tiêu là tối đa hóa những gì được thực hiện trong một chip, hay nói cách khác là giảm thiểu giao tiếp với bên ngoài chip ngay khi nhu cầu liên lạc của bạn tỷ lệ thuận với số lượng tế bào, bạn sẽ bị giới hạn băng thông. Vâng, điều đó có nghĩa là nếu bạn cần xem tất cả các ô cho mỗi bước, bạn có thể không tốt hơn nhiều so với GPU. (Tùy chỉnh đầy đủ sẽ chỉ cung cấp tích hợp tốt hơn, tức là nhiều ô hơn trên mỗi chip).
Tóm tắt: - nếu bạn muốn xem xét tất cả các trạng thái trung gian, GPU là cách tiếp cận hiệu quả nhất - nếu bạn không, bạn cần âm lượng để chứng minh ASIC có gì đó tốt hơn, có lẽ FPGA sẽ không cung cấp đủ lợi thế nếu chúng có bất kỳ.