Có một số khác biệt, tuy nhiên chúng không nhất thiết phải ở phần cứng hoặc thông số kỹ thuật. Lưu ý rằng đây là tất cả thông tin tôi có được từ các diễn đàn hoặc bản tin, vì vậy hãy lấy tất cả bằng một hạt muối.
Đầu tiên là "khả năng mở rộng và độ tin cậy" ( nguồn ). K20 được thiết kế để ngồi trong một hệ thống cụm và chạy ở chế độ nghiêng hoàn toàn 24/7. Titan được thiết kế nhiều hơn để chơi game, vì vậy nó sẽ chạy ở chu kỳ nhiệm vụ này, nhưng nó có thể phải chịu các vấn đề dài hạn suốt đời nếu được sử dụng theo cách này.
Các trình điều khiển cũng khác nhau, tuy nhiên tôi không chắc chắn về sự khác biệt lớn. Sự khác biệt về trọng tâm của thiết kế thẻ có thể dẫn đến tăng hiệu suất tương đối nhỏ cho thẻ Tesla ở mặt trước này.
"Một số tính năng độc quyền của Tesla bao gồm:
- NVIDIA GPUDirect RDMA cho hiệu năng InfiniBand
- Hyper-Q cho MPI (Hyper-Q cho CUDA Streams được hỗ trợ trên GeForce GTX TITAN)
- Bảo vệ ECC cho tất cả các thanh ghi và bộ nhớ trong và ngoài
- Các công cụ được hỗ trợ để quản lý GPU và cụm, chẳng hạn như Điện toán Sáng, Ganglia. "( Nguồn )
Điều này chỉ ra thực tế rằng sự khác biệt chính là khả năng mở rộng của chúng. Nếu bạn đang tìm cách chạy trên máy tính để bàn trong văn phòng của bạn, sẽ khó có thể tranh cãi với Titan so với K20 về chênh lệch giá. Nếu bạn cần hiệu suất bổ sung của nhiều K20, hãy tìm cho mình một trung tâm HPC và mua thời gian với máy chủ của họ.
Biên tập:
Sau khi tìm hiểu thêm một chút về ECC, tôi đang cập nhật câu trả lời này để chỉ ra ý nghĩa của việc có nó trên K20 chứ không phải trên Titan. Các thông tin sau đây là một cách diễn đạt thông tin được tìm thấy ở đây .
ECC đang kiểm tra lỗi trên DRAM và các thanh ghi cho GPU. Lỗi mềm là khi một bit được chuyển / lưu trữ không chính xác. Các mạch càng nhanh và càng gần nhau thì khả năng xảy ra lỗi mềm càng cao. Nếu bạn đang giải quyết một tập hợp các ODE được ghép nối hoặc giải một hệ thống tuyến tính, một số bị tắt một bit có thể thay đổi đáng kể kết quả theo cách không thể lặp lại. Hầu hết RAM và bộ nhớ cache tiêu chuẩn trong CPU đều được kiểm tra lỗi cho các lỗi này bằng ECC.
Mặt khác, GPU, nói chung, không có ECC mặc dù bus bộ nhớ của chúng nhanh hơn nhiều so với CPU. Điều này là do nếu một pixel trên màn hình bị tắt một chút cho một khung hình, chất lượng của chương trình không bị giảm. Những lỗi này cũng không propogate. Do đó, rất nhiều bất động sản chip (và chi phí) có thể được lưu bằng cách bỏ qua tính năng này. Sự phức tạp thêm này có thể gây ra một phần lớn chi phí thêm của dòng Tesla.