Tôi có một hệ thống HP ProLiant DL360 G7 mới đang gặp sự cố khó tái tạo. Các máy chủ bị treo một cách ngẫu nhiên tại " Sức mạnh và hiệu chuẩn nhiệt Đang tiến hành ... " màn hình trong suốt quá trình POST . Điều này thường đi theo khởi động / khởi động lại từ hệ điều hành đã cài đặt.
Hệ thống quầy hàng vô thời hạn tại thời điểm này. Việc thiết lập lại hoặc khởi động nguội thông qua bộ điều khiển nguồn ILO 3 làm cho hệ thống khởi động bình thường mà không gặp sự cố.
Khi hệ thống ở trạng thái này, giao diện ILO 3 hoàn toàn có thể truy cập và tất cả các chỉ số sức khỏe hệ thống đều ổn (tất cả đều màu xanh lá cây). Máy chủ nằm trong một trung tâm dữ liệu được kiểm soát khí hậu với các kết nối nguồn tới PDU. Nhiệt độ môi trường là 64 ° F / 17 ° C. Hệ thống được đặt trong vòng kiểm tra thành phần 24 giờ trước khi triển khai mà không gặp sự cố.
Hệ điều hành chính cho máy chủ này là VMWare ESXi 5. Ban đầu chúng tôi đã thử 5.0 và sau đó là bản dựng 5.1. Cả hai đều được triển khai thông qua khởi động và khởi động PXE. Ngoài ra, chúng tôi đang thử nghiệm với các bản cài đặt Windows và Red Hat Linux.
Các hệ thống HP ProLiant có một bộ tùy chọn BIOS toàn diện. Chúng tôi đã thử cài đặt mặc định bên cạnh cấu hình hiệu suất cao Tĩnh. Tôi đã tắt màn hình giật gân khởi động và chỉ nhận được một con trỏ nhấp nháy tại điểm đó so với ảnh chụp màn hình ở trên. Chúng tôi cũng đã thử một số "cách thực hành tốt nhất" VMWare cho cấu hình BIOS . Chúng tôi đã thấy một lời khuyên từ HP dường như phác thảo một vấn đề tương tự , nhưng không khắc phục được vấn đề cụ thể của chúng tôi.
Nghi ngờ có vấn đề về phần cứng, tôi đã yêu cầu nhà cung cấp gửi một hệ thống giống hệt nhau để giao hàng trong cùng ngày. Máy chủ mới là một bản dựng hoàn toàn giống hệt nhau ngoại trừ các đĩa. Chúng tôi đã chuyển các đĩa từ máy chủ cũ sang mới. Chúng tôi gặp vấn đề khởi động ngẫu nhiên tương tự trên phần cứng thay thế.
Bây giờ tôi có cả hai máy chủ chạy song song. Vấn đề xảy ra ngẫu nhiên trên đôi giày ấm. Giày lạnh dường như không có vấn đề. Tôi đang xem xét một số cài đặt BIOS bí truyền hơn như vô hiệu hóa Turbo Boost hoặc vô hiệu hóa hoàn toàn chức năng hiệu chỉnh nguồn. Tôi có thể thử những thứ này, nhưng chúng không cần thiết.
Có suy nghĩ gì không?
--biên tập--
Chi tiết hệ thống:
- DL360 G7 - 2 x X5670 CPU Hex-Core
- 96GB RAM (12 x 8GB DIMM điện áp thấp)
- Ổ cứng 2 x 146GB 15k SAS
- 2 x 750W nguồn điện dự phòng
Tất cả các chương trình cơ sở cập nhật kể từ Gói dịch vụ HP mới nhất để phát hành DVD ProLiant.
Gọi cho HP và truy tìm interwebz, tôi đã thấy đề cập đến tương tác ILO 3 xấu, nhưng điều này cũng xảy ra với máy chủ trên bảng điều khiển vật lý. HP cũng đề xuất nguồn điện, nhưng đây là giá đỡ trung tâm dữ liệu cung cấp năng lượng thành công cho các hệ thống sản xuất khác.
Có khả năng nào đây có thể là sự tương tác kém giữa các DIMM điện áp thấp và nguồn điện 750W không? Máy chủ này phải là một cấu hình được hỗ trợ.