Tại sao ổ đĩa Hitachi HDS5C3020 không liên kết bắt đầu tiêu thụ thêm 50% năng lượng sau 15 phút sau khi khởi động?


19

Trong hệ thống Debian 6.0.6 có 74 ổ đĩa Toshiba DT01ABA200 2TB. Các ổ đĩa này được xác định là các ổ đĩa Hitachi HDS5C3020BLE630 chạy bản sửa đổi phần mềm MZ4OAAB0. 64 Ổ đĩa được gắn qua thẻ mở rộng HP SAS vào bộ điều khiển LSI 2008 SAS, 5 ổ đĩa khác được kết nối trực tiếp với bo mạch chính, 4 ổ đĩa được kết nối với bộ điều khiển PCI dựa trên Sil và 1 ổ đĩa cuối chỉ được cấp nguồn và không có cáp dữ liệu được kết nối. Cả bộ điều khiển LSI và thẻ Sil của bộ điều khiển đều bị vô hiệu hóa và các mô-đun mpt2sas và sata_sil được gỡ bỏ khỏi Linux debian 2.6.32-5-amd64 # 1 SMP Sun ngày 23 tháng 10 10:07:46 UTC 2012 x86_64 GNU / Linux. Mô-đun mpt2sas được tải sau khi khởi động bằng lệnh modprobe trong /etc/rc.local. 74 ổ đĩa này không được phân vùng, không được định dạng và cũng không được gắn kết.

Hệ thống tiêu thụ:

  • với 0 ổ đĩa : 70,6 - 70,9 watt (cũng 15 phút sau khi khởi động);
  • với 74 ổ đĩa : 330 - 360 watt, ngay sau khi khởi động (tương đương 3,5 - 3,9W mỗi ổ ở trạng thái không hoạt động);
  • với 74 ổ đĩa : 420 - 466 watt, mỗi lần trong phút thứ 15 của thời gian hoạt động (tương đương 4,7 - 5,3W mỗi ổ ở trạng thái không hoạt động).

Thông số kỹ thuật ổ đĩa liệt kê 4,7W là đọc / ghi và 3,3W là mức tiêu thụ điện năng nhàn rỗi.

Mức tiêu thụ điện năng tăng cao rất có thể là trên đường dây 5V, vì sau khoảng 1 phút, "bảo vệ quá dòng" (OCP) của nguồn điện (PSU) sẽ tắt nguồn. PSU được sử dụng là một mô hình đường ray đơn có OCP> 122A trên đường dây 12V và> 55A trên đường dây 5V.

Hồi quy:

  • Việc ổ đĩa giá trị APM của nó được đặt thành vô hiệu hóa hay 1 (tiết kiệm năng lượng tối đa) không thành vấn đề.
  • Hệ điều hành ghi lại không có hoạt động đọc / ghi trong /proc/diskstats. Các giá trị giống hệt nhau (28 thao tác đọc, 0 ghi) ngay sau thao tác modprobe.
  • Không thể kiểm tra điều gì xảy ra khi khởi động vào bo mạch chính, đó là BIOS - để loại trừ bất kỳ sự can thiệp nào của HĐH - bởi vì bo mạch chủ Super Micro X8SI6-F chạy firmware 06/27/12 có lỗi đọc không chính xác nhiệt độ cảm biến CPU +74.0 C là " Cao "ở chế độ BIOS và tắt nguồn sau 1 phút.

Điều gì có thể gây ra hoạt động đọc / ghi ổ đĩa trên tất cả các ổ đĩa trong phút thứ 15 sau khi khởi động và làm thế nào để ngăn chặn nó xảy ra?


Chỉ tò mò ... Đây là loại hệ thống gì? Hệ thống dự phòng? Tất cả phần mềm RAID?
ewwhite

Hiện tại chỉ là thử nghiệm, dành cho lưu trữ sao lưu mà không cần bất kỳ RAID. Sự dư thừa sẽ được cung cấp bởi các máy chủ thứ cấp và đại học tùy chọn.
Sao lưu chuyên nghiệp

@ewwhite làm tôi nhớ đến Backblaze pods. Ai đó đã phải đề cập đến tên đó.
Dmitri Chubarov

$ chênh lệch nhiệt độ 6 độ giữa ổ đĩa mát nhất và ấm nhất.
Sao lưu chuyên nghiệp

Câu trả lời:


20

Âm thanh rất giống như các ổ đĩa đang thực hiện việc cọ rửa SMART (kiểm tra ngoại tuyến tự động).

smartctl -a /dev/hdx

nên xác nhận cấu hình với:

Auto Offline Data Collection: Enabled.

Vô hiệu hóa với:

smartctl --offlineauto=off /dev/hdx

Nó cũng có thể là một cái gì đó khác ...


smartctl --offlineauto=offđã lừa Ít nhất trong 32 phút, không có mức tăng tiêu thụ năng lượng khổng lồ nào khiến OCP PSU phải tắt máy. Là một phần thưởng hdparm -SX hiện đang đặt các ổ đĩa từ "hoạt động / không hoạt động" sang "chờ". Tuy nhiên, các ổ đĩa được gắn vào bộ điều khiển sata_sil không thể là bộ điều khiển. Tạm thời cắm các ổ đĩa này vào bộ điều khiển khác là cách giải quyết. Cài đặt thu thập dữ liệu ngoại tuyến tồn tại trong quá trình khởi động lại và chu kỳ nguồn.
Sao lưu chuyên nghiệp
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.