Vì vậy, tôi sẽ đặt ra một câu hỏi khác:
Tại sao cần phải chạy chẩn đoán phần cứng HP Insight trên các máy chủ trước khi cung cấp?
Trong nhận xét của tôi ở trên, tôi đã chỉ ra rằng có rất ít để đạt được bằng cách thực hiện điều này một cách nhanh chóng trong môi trường HP ProLiant lớn. Tôi nên làm rõ suy nghĩ của mình về điều đó ...
Theo thứ tự tần suất giảm dần, hãy xem xét các loại vấn đề bạn thường gặp phải:
Mảng lưu trữ và đĩa : Bộ điều khiển RAID sẽ báo cáo cho HĐH, nhật ký, SNMP, email, ILO và thắp sáng những ánh sáng đẹp để biểu thị sức khỏe.
RAM : Quá trình POST sẽ phát hiện trạng thái RAM, cũng như hệ thống báo cáo với HĐH, nhật ký, SNMP, email, ILO và thắp sáng một đèn LED trên bảng điều khiển Hệ thống hiển thị thông tin chi tiết (SID) . Ngoài ra, tôi không phải là người hâm mộ các quy trình ghi nhớ RAM vì khả năng phát hiện lỗi của các hệ thống này đã rất mạnh mẽ.
Nhiệt và quạt : Nhiệt độ máy chủ và tốc độ quạt được quy định bởi ILO. Có hơn 30 cảm biến nhiệt độ trên các hệ thống này , vì vậy hệ thống làm mát cực kỳ hiệu quả. Điều này vẫn báo cáo cho HĐH, nhật ký, SNMP, email và trên SID.
Nguồn cung cấp : Trạng thái PSU được báo cáo cho HĐH, nhật ký, SNMP, email và trên SID, cũng như đèn báo thực tế trên bộ cấp nguồn thực tế.
Sức khỏe tổng thể : Điều này dễ dàng được đánh giá từ một cái nhìn thoáng qua với màn hình SID, bên cạnh đèn LED Sức khỏe bên trong và Sức khỏe bên ngoài. Điều này cũng được báo cáo với nhật ký của máy chủ, SNMP, email và ILO.
Tôi không thể nghĩ ra bất kỳ điều kiện nào sẽ được tìm thấy trước khi triển khai mà không / không thể được báo cáo trong thời gian chạy hoặc cài đặt hệ điều hành.
Vòng lặp chẩn đoán thường sẽ không tìm thấy bất cứ điều gì khi chạy trên một hệ thống không có vấn đề rõ ràng trước đó. Điều này chủ yếu là do máy chủ cần POST và khởi động vào tiện ích hoặc phần mềm Cung cấp thông minh để chạy tiện ích.
Nói cách khác, bất kỳ mục nào là "SPOF" nghiêm trọng cho máy chủ có thể sẽ ngăn hệ thống chạy tự chẩn đoán.
Các mục thất bại phổ biến nhất vẫn còn khá mạnh mẽ; các đĩa phải ở dạng RAID và có thể hoán đổi được. Quạt và nguồn cung cấp năng lượng cũng nóng. RAM của bạn có ngưỡng ECC và có các tùy chọn dự phòng trực tuyến cho hầu hết các nền tảng ProLiant. Không có gì bạn có thể làm để gây ra sự thất bại trong các thành phần này bằng cách chạy chẩn đoán. Thêm một thực tế là bạn đang sử dụng vỏ HP C7000 Blade, có dự phòng nội bộ và tỷ lệ thất bại của bạn sẽ khá thấp.