GPU có bao nhiêu đơn vị song song mà GPU có?

Tôi muốn biết GPU có bao nhiêu đơn vị song song để xử lý các đỉnh .

Trang Wikipedia này cung cấp GFLOPS và tốc độ xung nhịp, ví dụ cho Radeon 5850 "Broadway PRO", bạn nhận được 1000 GFLOPS. Giả sử chạy một shader đỉnh là 100 flops, điều đó có nghĩa là bạn có thể xử lý 1000e9 / 100 = 10e9 đỉnh mỗi giây.

Có nhà sản xuất nào công bố số lượng đơn vị xử lý song song , hoặc cách để biết số đó không?

gpu

— bobobobo
nguồn

Nó thay đổi từ mỗi mô hình thẻ tiếp theo. Mục tiêu của câu hỏi này là gì?

— Tấn

Tôi đồng ý với AttackHobo, số lượng lõi không liên quan vì mỗi chip có số lượng khác nhau và chúng cũng hoạt động khác nhau nên trong mô hình 30 lõi có thể mạnh hơn một lõi với 60 lõi. Ngoài ra, bạn sẽ phải tham khảo từng thông số chip từ nhà sản xuất nếu bạn không tin vào thông tin có trong wikipedia (có lẽ chính xác)

— Pablo Ariel

stackoverflow.com/questions/6490572/

— Mạnh

archive.is/ijlYA#selection-285.296-285.499

— Pacerier

Câu trả lời:

Giả sử chạy một shader đỉnh là 100 flops, điều đó có nghĩa là bạn có thể xử lý 1000e9 / 100 = 10e9 đỉnh mỗi giây.

Không, nó chắc chắn là không.

Về cơ bản, bạn nên xem xét bất kỳ tính toán nào về tốc độ thực thi của bất kỳ mã nào chỉ dựa trên số lượng "FLOPS" là đáng ngờ. Thật vậy, nói chung là tốt nhất nếu bạn hoàn toàn bỏ qua FLOPS.

Bạn đã không định nghĩa thuật ngữ "đơn vị song song"; không có định nghĩa đó, chúng tôi chỉ có thể đoán những gì bạn muốn.

Lấy Radeon 5870. Nó có 1600 đơn vị điểm nổi. Điều đó có nghĩa là, đối với mỗi chu kỳ, nó có thể thực hiện 1600 phép toán dấu phẩy động vô hướng cùng một lúc. Tuy nhiên, mỗi opcode VLIW hoạt động trên các thanh ghi toán học vectơ 5 chiều. Vì vậy, độ chi tiết nhỏ nhất có thể có của mã thực tế là 1600/5 hoặc 320 (lưu ý: đây là một sự đơn giản hóa lớn ). Đó là 320 chủ đề.

Tuy nhiên , đó không thực sự là cách nó hoạt động. Bạn không có 320 đường thực hiện riêng biệt đang diễn ra. Bạn không thể có 320 đoạn mã khác nhau thực thi trên 320 đơn vị khác nhau. Xem, các VLIW 5 chiều được nhóm thành các lõi SIMD 4 chiều. Mỗi SIMD có thể có đường dẫn thực hiện riêng và mã nguồn riêng. Mỗi VLIW trong lõi SIMD có thể có dữ liệu riêng để chúng tính toán các giá trị riêng biệt. Nhưng mỗi VLIW trong lõi SIMD thực hiện các hướng dẫn tương tự trong bước khóa với các VLIW khác trong lõi đó.

Vì vậy, thực sự, bạn chỉ có 320/4, hoặc 80 tổng số chủ đề. Nhưng một lần nữa, nó phụ thuộc vào loại "đơn vị song song" mà bạn đang nói đến. Về mặt kỹ thuật, 1600, 320 và 80 đều là những câu trả lời hợp pháp.

Và đó chỉ là một kiến trúc cụ thể . Dòng Fermi của NVIDIA (GeForce 4xx trở lên) sử dụng kiến trúc rất khác biệt. Dòng Cayman của ATI (Radeon 69xx) thay đổi VLIW 5 chiều thành VLIW 4 chiều. Kiến trúc tiếp theo của họ có thể có một số khác biệt đáng kể quá.

Không biết bạn đang tìm kiếm điều gì, không có cách nào để trả lời câu hỏi.

— Bolol
nguồn

Tuyệt quá. Tôi tìm thấy này bài viết về kiến trúc GPU, là tốt, nhưng nơi mà bạn đã tìm ra số lượng đơn vị dấu chấm động? Đó là những gì tôi đang tìm kiếm.

— bobobobo

@bobobobo: Đó là trong trang Wikipedia mà bạn liên kết đến. Ngoài ra, bài viết GPU Gems đó dành riêng cho dòng GeForce 6-7. Nó cũng 6 tuổi.

— Nicol Bolas

Thật thú vị khi bạn phát âm SIMD bằng các chữ cái riêng lẻ. VLIW là một câu nói khó hiểu bởi bất cứ điều gì khác ngoài các chữ cái của nó, nhưng hầu hết (tất cả, trên thực tế) các lập trình viên hệ thống mà tôi đã làm việc với câu nói "sim dee".

— Andon M. Coleman

@NicolBolas, Dude, 80 hướng dẫn đồng thời? Sự hiểu biết đó vẫn đánh bại 8 hoặc 16 thông thường bạn nhận được từ CPU.

— Pacerier

Tôi không hiểu, ý của đơn vị xử lý song song là gì? đơn vị đổ bóng? Bởi vì một ppu và một gpu ngày nay về cơ bản là giống nhau, nên ý tôi là ppu là gpu nếu chúng ta đang nói về ati radeon.

Tôi cho rằng bạn có nghĩa là các đơn vị chức năng, bạn phải đọc Config coretrường trong wikipedia:

Config Core – The layout of the graphics pipeline, in terms of functional units. Over time the number, type and variety of functional units in the GPU core has changed significantly; before each section in the list there is an explanation as to what functional units are present in each generation of processors.

Vì vậy, đối với radeon bạn nói nó sẽ có:

Unified Shaders (Vertex shader/Geometry shader/Pixel shader) : Texture mapping unit : Render Output unit

mà đối với broadway pro là: 800:40:16

điều này có nghĩa là nó có 800 đơn vị đổ bóng, 40 đơn vị ánh xạ kết cấu và 16 đơn vị đầu ra kết xuất.

EDIT: À không, có vẻ như đơn vị xử lý song song cũng được áp dụng cho những gì bạn muốn nói, vì vậy tôi cho rằng thật khó hiểu khi gọi chúng theo cách đó. Tôi sẽ gọi chúng là các đơn vị shader hoặc lõi simd.

— Pablo Ariel
nguồn

Có một PPU ??

— Pacerier