Intel Knight Landing tải công việc so với NVIDIA GeForce


8

Có rất nhiều bài báo được viết về cách Intel Xeon Phi mới ra mắt sẽ đánh cắp thị phần HPC \ Super Computer từ các đối thủ. Intel Knight được trang bị 72 lõi và 4 ổ cắm làm cho hệ thống 288 lõi. Trong khi đó, một Gtx980 có 2048 nhân CUDA. Làm thế nào hai điều này có thể cạnh tranh về sức mạnh tính toán (Có vẻ như GTX đang đi trước)? Hoặc họ đang nhắm mục tiêu tải công việc hoàn toàn khác nhau, trong trường hợp một số ví dụ là gì?

Cảm ơn.


1
Bạn có thể nhìn vào sự so sánh khác biệt ở đây . Nhưng điều này có phần phụ thuộc vào nhiệm vụ trong tầm tay.
dùng189035

1
Liên kết đó là khá nhiều thông tin. Cám ơn vì đã chia sẻ.
Chandan

Câu trả lời:


8

Giống như Brian đã nói, lõi Xeon Phi hoàn toàn không thể so sánh với các lõi CUDA. Vấn đề với Phi là ở đâu đó giữa hai con ngựa.

Nếu bạn đang thực hiện các phép tính dấu phẩy động song song cao, NVIDIA sẽ cung cấp cho bạn hiệu năng gấp 3 lần giá chỉ bằng 1/4. Đối với độ chính xác gấp đôi, khoảng cách nhỏ hơn, nhưng NVIDIA vẫn rẻ hơn 20% cho cùng hiệu năng.

Nếu vấn đề của bạn rất khó song song, Phi sẽ không giúp bạn chút nào và thay vào đó, một thứ như Intel Xeon sẽ mang lại cho bạn hiệu suất tốt nhất.

Điểm ngọt ngào đối với Phi sau đó là một thứ gì đó rất song song, nhưng khác nhau, tức là mỗi luồng phải làm một cái gì đó khác nhau. Một ví dụ về điều này sẽ là mô phỏng Monte Carlo. Ví dụ, chúng được sử dụng trong các mô phỏng phương pháp điều trị xạ trị, trong đó GPU chỉ tăng tốc độ nhỏ (~ 2x) so với CPU tiêu chuẩn.

Intel cũng đang cố gắng bán Xeon Phi với thực tế là bạn chỉ cần viết lại mã của mình một cách tối thiểu. Tuy nhiên, đối với bất cứ điều gì không tầm thường để song song, công việc sẽ trở nên giống như đối với GPU.


Ngoài ra, đối với các học giả có thể nhận bộ công cụ OpenACC miễn phí , việc viết lại mã cho thẻ NVIDIA không nhất thiết phải khó khăn như vậy!
dr.blochwave

Không chỉ là bạn không phải viết lại bằng CUDA mà còn cả Xeon Phi hỗ trợ các mô hình lập trình chạy trên các nền tảng khác. Có rất ít sự khác biệt giữa điều chỉnh cho Xeon và Xeon Phi hiện đại - cả hai đều yêu cầu phân luồng và vector hóa cẩn thận. Và những gì chạy tốt trên Xeon nên chạy tốt trên CPU của AMD, ARM và IBM. Mặt khác, các mô hình của NVIDIA sẽ khóa bạn vào phần cứng của chúng.
Jeff

Tôi tôn trọng không đồng ý. Mặc dù Xeon 22 lõi và Xeon Phi có thể giống nhau, nhưng nó rất khác so với AMD 4 lõi và thậm chí còn hơn thế đối với bộ xử lý ARM, có bộ lệnh hoàn toàn khác. Đối với NVIDIA khóa bạn vào phần cứng của họ, cả AMP và OpenCL đều cho phép bạn chạy mã của mình trên các thiết bị AMD và CPU thực sự.
LKlevin

Tập lệnh không quan trọng trừ khi bạn viết lắp ráp. Tôi đã điều chỉnh mã cho PowerPC, POWER, AMD Opteron, tất cả các loại Xeon và cả KNC và KNL. Các kỹ thuật phần lớn giống nhau ngoại trừ các sắc thái phân cấp bộ nhớ. OpenMP C / Fortran của tôi hoàn toàn di động với các lỗi biên dịch.
Jeff

7

Các lõi CUDA hoàn toàn không thể so sánh với các lõi xử lý riêng biệt trong bộ đồng xử lý Xeon Phi. Các lõi của bộ đồng xử lý Phi là các bộ xử lý hoàn chỉnh có thể có các vòng lặp riêng, phân nhánh, v.v. trong khi các lõi CUDA đều thực hiện các hoạt động giống nhau trên các lát dữ liệu khác nhau của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.