Bạn sẽ cần biết mô hình và nhà cung cấp CPU trong máy của bạn. Khi bạn đã có, bạn có thể tra cứu trên trang web của nhà cung cấp (hoặc có thể trên Wikipedia) tốc độ xung nhịp, số chip / ổ cắm, số lõi trên mỗi chip, số lượng hoạt động điểm nổi trên mỗi chu kỳ và độ rộng vectơ của các hoạt động đó . Sau đó, bạn chỉ cần nhân lên.
Lấy ví dụ, bộ xử lý Intel Xeon E5-2680 "Sandy Bridge" ở Stampede nơi tôi làm việc. Thông số kỹ thuật là:
- 2,7 GHz
- 2 chip / nút, 8 lõi / chip
- 2 hướng dẫn vector / chu kỳ
- Hướng dẫn AVX rộng 256 bit (4 toán hạng chính xác kép đồng thời)
Nhân số đó cho 345,6 GF / nút hoặc 2,2 PF cho phần chưa được tăng tốc của hệ thống.
Chúng tôi thường nghĩ về các hoạt động có độ chính xác kép (64 bit), vì đó là độ chính xác cần thiết cho đại đa số người dùng của chúng tôi, nhưng bạn có thể làm lại phép tính theo thuật ngữ chính xác đơn nếu muốn. Điều này thường chỉ thay đổi yếu tố cuối cùng, giả sử 8 SP Flops / hướng dẫn thay vì 4 DP Flops / inst, nhưng nó có thể khác rất nhiều so với điều đó. Chẳng hạn, các GPU cũ hơn chỉ làm DP ở mức 1/8 tốc độ SP. Nếu bạn từng trích dẫn một số cho hệ thống của mình, bạn nên nói rõ về cái mà bạn đã sử dụng nếu nó không chính xác gấp đôi vì mọi người sẽ cho rằng đó là, nếu không.
Ngoài ra, nếu chip của bạn hỗ trợ các lệnh đa bội (FMA) được hợp nhất và nó có thể thực hiện chúng ở mức đầy đủ, thì hầu hết mọi người đều coi đây là 2 thao tác dấu phẩy động mặc dù bộ đếm hiệu suất phần cứng có thể chỉ coi đó là một lệnh.
Cuối cùng, bạn cũng có thể làm điều này cho bất kỳ máy gia tốc nào có thể tồn tại trong hệ thống của bạn (như GPU hoặc Xeon Phi) và thêm hiệu suất đó vào hiệu suất CPU để có được tổng số lý thuyết.