Tôi đang ở trong một môi trường chứa nhiều máy chủ Supermicro được trang bị bộ điều khiển RAID phần cứng Adaptec và LSI MegaRAID . Các bộ điều khiển này chứa các mô-đun bộ đệm được hỗ trợ bằng pin để giúp tăng hiệu suất ghi và bảo vệ dữ liệu truyền.
Một vấn đề hỗ trợ thường xuyên là lỗi pin điều khiển RAID. Sự thay đổi này, các mảng từ ghi lại để viết qua chế độ. Rõ ràng có một tác động hiệu quả tiêu cực khi hệ thống chạy với tốc độ ghi bị suy giảm. Điều này vẫn tồn tại cho đến khi một cửa sổ thời gian chết có thể được thiết lập để tắt nguồn hệ thống và thay pin.
Đây là một hoạt động rất thường xuyên đối với chúng tôi; gần như hàng tuần trên vài nghìn máy chủ vật lý ... Chúng tôi thậm chí còn có các trạm sạc để chuẩn bị pin thay thế để có thể hoán đổi mà không cần chu kỳ sạc.
Có lẽ tôi bị hư hỏng bởi một lịch sử lâu dài với các máy chủ HP ProLiant và bộ điều khiển RAID mảng thông minh , nhưng các hệ thống HP thường có tuổi thọ pin từ 4 - 6 năm. Cuối cùng họ đã loại bỏ việc sử dụng pin RAID vào khoảng năm 2009. Chúng đã được thay thế bằng các mô-đun bộ nhớ được hỗ trợ bởi siêu tụ điện (bộ đệm ghi flash được hỗ trợ hoặc FBWC) và không yêu cầu thay thế, thải bỏ hoặc chu kỳ sạc ban đầu dài.
Vì tôi thấy các lỗi của bộ điều khiển Adaptec và LSI đôi khi xảy ra trên các hệ thống đã hoạt động dưới 12 tháng, tôi tự hỏi liệu điều này có phổ biến trong các môi trường khác không.
Nếu điều này là phổ biến, làm thế nào để các môi trường máy chủ lớn khác xử lý việc này?
- Bất kỳ mẹo hoặc thủ thuật để xử lý thay thế pin RAID?
- Có bất kỳ tham số cấu hình có thể giúp đỡ?
- Làm thế nào phá vỡ điều này để hoạt động trong môi trường của bạn ?
- Có thể làm mát khung gầm kém và nhiệt độ là một yếu tố?
- Có phải chúng ta làm sai điều gì?
- Bộ điều khiển Dell PERC được sản xuất bởi LSI. Các môi trường Dell có trải nghiệm tuổi thọ pin ngắn không?
Tài liệu sản phẩm LSI phác thảo một pin thế hệ mới có thể hoạt động lâu hơn 1 năm.
Máy chủ HP ProLiant DL585 G2 với hơn 1000 ngày hoạt động và pin RAID hạnh phúc ...
# uptime
05:38:08 up 1031 days, 44 min, 31 users, load average: 0.49, 0.64, 0.99
# hpacucli
Cache Board Present: True
Cache Status: OK
Accelerator Ratio: 50% Read / 50% Write
Total Cache Size: 512 MB
Battery Pack Count: 1
Battery Status: OK