Trong Prime95, tại sao các FFT nhỏ tạo ra nhiều nhiệt nhất, mặc dù CPU ở mức 100% cho tất cả các tùy chọn?


9

Tôi vừa mới xây dựng một PC Skylake mới và tôi sẽ thấy một chút về việc ép xung với Prime95 như một máy kiểm tra căng thẳng.

Nó hoạt động tốt trong sử dụng bình thường, nhưng với Prime95 tôi nhận thấy một chút điều chỉnh CPU dưới một số tải nhất định.

Nếu tất cả 4 lõi (8 luồng) bị kẹt ở mức 100% bất kể, tại sao cài đặt FFT nhỏ trong Prime95 lại có nhiệt độ cao hơn tùy chọn 'Blend'?

Câu trả lời:


13

Mã Vectorized, đặc biệt là AVX, tự nhiên tăng sản lượng nhiệt CPU vì bộ xử lý phải hoạt động ở điện áp cao hơn để thực hiện các hướng dẫn này. Các FFT nhỏ đòi hỏi ít bộ nhớ hơn chế độ hòa trộn, do đó bộ xử lý dành nhiều thời gian xử lý dữ liệu hơn và ít thời gian chờ đợi dữ liệu hơn.

  • Kiến trúc x86-64 cung cấp khả năng xử lý vector mở rộng , đặc biệt là trên các bộ xử lý mới nhất. Xử lý véc tơ cho phép các ứng dụng thực hiện các hoạt động toán học trên nhiều mục dữ liệu cùng một lúc và được sử dụng bởi nhiều ứng dụng chuyên sâu tính toán mới hơn để tăng thông lượng xử lý.

  • Mã vector, đặc biệt là các lệnh AVX được Prime95 sử dụng, yêu cầu bộ xử lý hoạt động ở điện áp cao hơn bình thường. Điều này dẫn đến tiêu thụ năng lượng và sản lượng nhiệt lớn hơn những gì đã trải qua trong khối lượng công việc bình thường. Vì lý do này, Intel cảnh báo rằng tải nặng AVX có thể khiến bộ xử lý tăng tốc hoặc không duy trì tốc độ xung nhịp Turbo Boost đầy đủ (chú thích 1):

    Phần mở rộng vectơ nâng cao Intel® (Intel® AVX) được thiết kế để đạt được thông lượng cao hơn cho các hoạt động số nguyên và dấu phẩy động nhất định. Do đặc điểm công suất của bộ xử lý khác nhau, việc sử dụng các hướng dẫn AVX có thể khiến a) một số bộ phận hoạt động ở tần số thấp hơn và b) một số bộ phận với Intel® Turbo Boost Technology 2.0 để không đạt được bất kỳ hoặc tần số turbo tối đa nào.

    Intel giải thích điều này chi tiết hơn trong bài báo trắng này . Đặc biệt, nó lưu ý:

    Intel AVX được thiết kế để đạt được thông lượng cao hơn cho các hoạt động số nguyên và dấu phẩy động nhất định. Sử dụng các hướng dẫn này có thể khiến bộ xử lý hoạt động ở tần số thấp hơn tần số TDP đã đánh dấu. Việc giảm tần số này xảy ra do các hướng dẫn Intel AVX công suất cao yêu cầu thêm điện áp và dòng điện.

    • Tôi đoán tại sao việc tăng cường lõi V lại cần thiết cho các hướng dẫn AVX là các đơn vị thực thi AVX phức tạp hơn các bộ phận khác của bộ xử lý, dẫn đến các giai đoạn đường ống tương ứng mất nhiều thời gian hơn (xem câu trả lời này để biết thêm thông tin kỹ thuật về đường ống và các khía cạnh khác của thiết kế bộ xử lý). Nếu một giai đoạn đường ống cụ thể chậm, tốc độ xung nhịp tối đa của toàn bộ bộ xử lý bị giới hạn vì mọi giai đoạn trong đường ống phải kết thúc trong mỗi chu kỳ xung nhịp.

    • Vì lý do tương tự, điện áp cao hơn làm tăng tần số đạt được tối đa khi ép xung (bóng bán dẫn có thể chuyển đổi nhanh hơn ở điện áp cao hơn), tăng điện áp giúp đảm bảo rằng các giai đoạn đường ống dài hơn có thể kết thúc đúng thời gian.

  • Chế độ FFT nhỏ chỉ sử dụng các mục dữ liệu nhỏ hơn có thể vừa trong bộ đệm CPU , không giống như chế độ Blend hoạt động trên cả các giá trị nhỏ và lớn có thể không vừa với bộ đệm. Vì việc truy cập bộ nhớ chậm so với việc xử lý dữ liệu đơn giản, bộ xử lý sẽ tốn ít thời gian hơn để xử lý dữ liệu thực sự ở chế độ Blend, giảm nhiệt lượng. Các FFT nhỏ không đòi hỏi bất cứ nơi nào gần nhiều bộ nhớ truy cập, dẫn đến công việc thực tế hơn cho CPU để thực hiện, do đó làm tăng mức tiêu thụ năng lượng và sản lượng nhiệt.


Cảm ơn @DragonLord, điều này làm cho các chế độ Prime95 khác nhau rất rõ ràng. Xin vui lòng bạn khuếch đại câu trả lời của bạn để giải thích tại sao trình giám sát tài nguyên đọc 100% trong cả hai trường hợp? Chẳng hạn, tại sao nó không đọc ít hơn 100% ở chế độ Blend, nếu nó chờ dữ liệu nhiều thời gian hơn ở chế độ FFT nhỏ?
ChrisA

1
CPU bận chờ bộ nhớ vẫn được báo cáo là bận với HĐH, như tôi hiểu.
bwDraco
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.