Trên một máy chủ CPU kép, việc một CPU chạy nóng hơn các CPU khác là bình thường?


51

Tôi có một máy chủ Opteron kép chạy Linux với libvirt để lưu trữ một số máy ảo. Các máy ảo hoạt động tốt và máy chủ xử lý tốt, nhưng tôi nhận thấy một CPU luôn chạy khoảng 69C (throttles ở 70C) và máy còn lại chạy khoảng 15C.

Điều này dường như không bình thường với tôi? Không phải cả hai nên gần nhiệt độ hơn một chút sao?

Tôi không chắc chắn làm thế nào để giảm bớt nữa. Có lẽ không đủ dán nhiệt trên một trong các CPU?

Chỉnh sửa: Bo mạch chủ là ASUS KGPE-D16 và được làm mát bằng quạt kép Noctua NH-U9DO .

Lưu ý rằng tôi nghĩ rằng nhiệt độ có thể bị suy giảm trên môi trường xung quanh, chứ không phải là giá trị tuyệt đối? Khi máy chủ không hoạt động, nhiệt độ CPU giảm xuống 2C và 13C. Tôi đang sử dụng cấu hình lmsensors từ đây


1
Máy chủ / mô hình là gì?
ewwhite

2
Làm thế nào là phân phối tải CPU? mpstat -P ALL 1trên linux sẽ giúp
Christopher Perrin

3
âm thanh như cảm biến nhiệt độ bị hỏng
trận đấu

14
15C rất có thể là một kiểm duyệt bị hỏng ....
Reaces

Có vẻ như một cảm biến bị hỏng hoặc được hiệu chỉnh kém, nếu bạn có thể khởi động lại máy chủ, hãy xem BIOS sẽ hiển thị các giá trị chính xác.

Câu trả lời:


106

Vấn đề cuối cùng là một tản nhiệt kém phù hợp. Có lẽ kém phù hợp không phải là mô tả đúng. Hóa ra, bạn phải dán miếng dán nhiệt lên tản nhiệt chứ không phải vỏ nhựa đi qua tản nhiệt.

nhập mô tả hình ảnh ở đây

Sau khi tháo vỏ nhựa, CPU rất đẹp và mát mẻ, cảm ơn mọi người!


51
+1 chỉ vì nó buồn cười
HBruijn

9
Bạn có nghĩa là ai đó để lại nắp nhựa tại chỗ và sau đó dán dán vào nó và sau đó đặt tản nhiệt trên đó? Sử thi.
TomTom

4
Baaaaaahaaahaaahahahaa !!
Craig

8
Tôi thích cách bạn có thể xem các điều khoản và điều kiện, chính sách bảo hành và trả lại có giới hạn trong nền. :)
Cuộc đua nhẹ nhàng với Monica

6
Nếu nó làm cho bạn cảm thấy bớt ngu ngốc hơn, (và nó sẽ không), tôi đã làm một điều tương tự với máy pha cà phê văn phòng mới của tôi. Cà phê quá lạnh để uống và tôi đã đóng gói lại để trở lại cửa hàng trước khi một đĩa các tông bảo vệ rơi ra khỏi bộ phận làm nóng :)
Martin James

25

Theo kinh nghiệm của tôi, việc các thành phần được ghép nối trong trường hợp chạy ở nhiệt độ khác nhau là điều bình thường, bởi vì luồng không khí không giống nhau ở mọi nơi. Đây là biểu đồ nhiệt độ ổ cứng từ hộp colo của tôi. Các ổ đĩa được nhân đôi, vì vậy khối lượng công việc trên chúng gần giống nhau.

đồ thị munin của temps HDD trong năm qua

Như bạn có thể thấy, họ theo dõi nhau, nhưng chúng không giống nhau; Trung bình họ cũng chỉ cách nhau 6C. Cho dù các cảm biến của bạn báo cáo nhiệt độ tuyệt đối hoặc nhiệt độ quá cao, chênh lệch 55C dưới tải có vẻ rất sai. Nếu bạn tin tưởng dữ liệu là đúng, thì khi chênh lệch giảm xuống còn 10C, đó là loại khác biệt tôi thấy do luồng khí, tôi nghi ngờ một tản nhiệt được trang bị kém.


1
Sử dụng mpstat (từ Christopher Perrin, cảm ơn!) Tôi xác nhận rằng tải được phân phối khá đều. Hiện tại mọi thứ đang không hoạt động ở + 3C và + 20C. Tôi sẽ thử nghịch với tản nhiệt để xem nó có bị lỏng không. Bạn có nghĩ rằng nó có thể là một vấn đề dán nhiệt?
samoz

Điều đó là rất có thể (và hơn thế nữa sau khi bạn bắt đầu vẫy nó).
MadHatter

8

Không phải vậy. Trừ khi bạn có một số vấn đề nghiêm trọng với luồng không khí. Hoặc một trong những bộ làm mát là xấu. Nhiệt độ SILL khác nhau - nhưng không nhiều (70 so với 15 độ C).

Cho rằng mức độ thấp 15 độ tôi sẽ giả sử (a) cảm biến của bạn tắt (bạn có thực sự lưu trữ máy chủ trong một căn phòng mát mẻ đó không?).

Tôi cũng sẽ cho rằng một trong những CPU đơn giản là không hoạt động, vì bất kỳ lý do gì.

Sự khác biệt nhỏ là bình thường. Một số cái lớn hơn có thể là (luồng không khí đến với tâm trí của tôi). nhưng ở đây chúng ta nói về một người bị CẮT.


2

Điều này có thể là làm mát hoặc tải không đồng đều (với sự khác biệt tạm thời tình huống của bạn có thể là tải không đều). Bạn nên sử dụng một cái gì đó như Prime95 để tải tất cả các lõi một cách đồng đều và xem nếu temps vẫn thay đổi. Nếu không, bạn cần cân bằng máy ảo, kiểm tra xem ứng dụng của bạn có đa luồng và bận không. Làm thế nào để làm điều đó phụ thuộc vào phần mềm và khối lượng công việc cá nhân của bạn vì vậy vượt quá phạm vi của câu hỏi thực sự. Lưu ý rằng không có lợi thế thực sự khi làm điều này nếu bạn không có đủ tải để vượt qua một lõi / lõi đơn, thực tế VM của bạn có thể cố tình tránh sử dụng cpu thứ hai để có thể chuyển sang chế độ tiết kiệm năng lượng trên đa hệ thống -cpu.

Nếu bạn đã thu hẹp nó để làm mát. Một sự khác biệt nhỏ lên đến 10C có thể là quá ít (hoặc quá nhiều!) Dán nhiệt. Một sự khác biệt lớn hơn cho thấy một vấn đề quan trọng hoặc sự khác biệt giữa các bộ làm mát cpu. Nó có thể là một người đã chặn luồng không khí, một tản nhiệt đã bị đánh bật, vv


0

Tôi sẽ phải đồng tình với, tạm thời khiếm khuyết. Cảm biến, vì 15C chỉ 59F !!! Trừ khi máy tính ở một trung tâm dữ liệu cực kỳ lạnh lẽo, tôi sẽ tưởng tượng nhiệt độ không khí xung quanh sẽ cao hơn 59F! Bạn thử gán VM cho lõi nhiệt độ thấp và xem liệu có bất kỳ thay đổi nào không; nếu không, tôi rất có thể nghi ngờ cảm biến bị lỗi.

Bạn cũng có thể muốn xem đầu ra của dmesg(thông điệp khởi động) và xem liệu có bất cứ điều gì khác thường ở đó không.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.