Làm cách nào để theo dõi trạng thái ổ cứng phía sau Bộ điều khiển Raid Dell PERC H710 với CentOS 6?


26

Tôi có một máy chủ Dell đang chạy CentOS 6bằng PERC H710thẻ Raid Controller với thiết lập Raid 5 và tôi muốn theo dõi tình trạng lỗi / hoạt động của đĩa cứng phía sau Bộ điều khiển Raid.

Sau đó, tôi sẽ có thể sử dụng tập lệnh bash để theo dõi trạng thái đĩa cứng và gửi email cảnh báo nếu có sự cố.

Công LSI MegaRAID SAScụ lệnh (Giới thiệu về LSI MegaRAID SAS Linux Tools) cho CentOS / Red Hat / Linux KHÔNG hỗ trợ PERC H710 và smartctlcũng không hỗ trợ.

Dựa trên trang web Dell, CentOSIS không được hỗ trợ cho máy chủ này ( NX3200 PowerVault) và tôi không thể tải xuống bất kỳ chương trình linux nào để theo dõi đĩa cứng.

[root@server ~]# lspci | grep RAID
03:00.0 RAID bus controller: LSI Logic / Symbios Logic MegaRAID SAS 2208 [Thunderbolt] (rev 05)


[root@server ~]# smartctl -a /dev/sda
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-431.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

Vendor:               DELL
Product:              PERC H710
Revision:             3.13
User Capacity:        299,439,751,168 bytes [299 GB]
Logical block size:   512 bytes
Logical Unit id:      ....
Serial number:        ....
Device type:          disk
Local Time is:        Tue Apr 15 16:38:30 2014 SGT
Device does not support SMART

Error Counter logging not supported
Device does not support Self Test logging

Bất cứ ai cũng biết cách theo dõi tình trạng đĩa cứng đằng sau cuộc đột kích phần cứng trên Dell PERC H710 với CentOS 6?

Câu trả lời:


26

SMARTkhông quyết định cuối cùng trong đĩa hoặc lưu trữ theo dõi !! Đây là một thành phần, nhưng bộ điều khiển RAID hiện đại sử dụng nó cùng với các phương pháp khác để xác định tình trạng ổ đĩa và mảng.

Tôi giả sử đây là bộ điều khiển PERC trong máy chủ Dell PowerEdge.

Cách tiếp cận thân thiện với Linux thông thường để theo dõi sức khỏe của phần cứng Dell là cài đặt các tác nhân Dell OMSA cho Linux thông qua Yum - http://linux.dell.com/wiki/index.php/Repousing/OMSA#Yum_setup

yum install srvadmin-allsẽ cài đặt bộ đại lý đầy đủ. Sau khi cài đặt, bạn có thể sử dụng omreportlệnh để lấy thông tin về mảng của mình.

Ví dụ:

$ omreport storage vdisk

$ omreport storage pdisk controller=0

$ omreport storage vdisk controller=0 vdisk=1

7
điều này sẽ cài đặt các thành phần bổ sung như máy chủ web / ssl trên các máy Linux của tôi nhưng có vẻ như tôi không có lựa chọn nào khác! Tôi ghét phải thêm các gói không cần thiết vào máy chủ của tôi.
Xianlin

2
Cảnh giác với rò rỉ bộ nhớ tiềm năng từ một trong những chương trình OMSA đó. Nó xảy ra với tôi từ từ trong suốt 3-4 tuần sau đó bùng nổ, không còn bộ nhớ nào cho linux.
bksunday

1
Có, rò rỉ là trong dsm_sa_snmpd (vì vậy tôi chạy 'killall -9 dsm_sa_snmpd', đã giải quyết).
markusN

5
Bộ điều khiển PERC 7xx và 8xx chỉ là bộ điều khiển LSI Megaraid và công cụ LSI MegaCLI sẽ hoạt động tốt nếu bạn không muốn làm mờ hệ thống của mình với các thư viện dell và bất kỳ dịch vụ nào khác và / hoặc các mô-đun hạt nhân mà chúng sẽ bỏ trong những ngày này. Có rất nhiều bảng cheat MegaCLI, tập lệnh giám sát nagios và mẹo điều chỉnh hiệu suất hiện có cho nhị phân LSI. Tất nhiên đó chỉ là sở thích cá nhân và quan điểm của tôi. Tôi là một người tối giản.
Aaron

@Xianlin, điều này không hoàn toàn đúng. Vâng, nó sẽ cài đặt rất nhiều rác nhưng xem câu trả lời của tôi. Tôi không muốn thêm các gói không cần thiết vì vậy tôi chỉ tìm ra những gói tôi cần để lưu trữ.
Mike S

25

Bạn có thể thấy trạng thái SMART của các đĩa bằng lệnh smartctl và -dđối số của nó . Ví dụ, để xem đĩa đầu tiên trong mảng:

# smartctl -a /dev/sda -d sat+megaraid,00
smartctl 5.43 2012-06-30 r3573 [x86_64-linux-2.6.32-358.6.2.el6.x86_64] (local build)
Copyright (C) 2002-12 by Bruce Allen, http://smartmontools.sourceforge.net

=== START OF INFORMATION SECTION ===
Device Model:     ST91000640NS
Serial Number:    ........
LU WWN Device Id: . ...... .........
Firmware Version: AA08
User Capacity:    1,000,204,886,016 bytes [1.00 TB]
Sector Size:      512 bytes logical/physical
Device is:        Not in smartctl database [for details use: -P     showall]
ATA Version is:   8
ATA Standard is:  ATA-8-ACS revision 4
Local Time is:    Thu Jul 10 11:21:52 2014 WEST
SMART support is: Available - device has SMART capability.
SMART support is: Enabled

=== START OF READ SMART DATA SECTION ===
SMART overall-health self-assessment test result: PASSED
Warning: This result is based on an Attribute check.
...
...
#

Đây là trên Science Linux 6 (một hệ điều hành dựa trên RHEL6 khác) với smartmontools-5.43-1.el6.x86_64.


-d megaraid,0là đủ trong smartctl 6.6dòng lệnh. Trong DEVICESCANchuỗi /etc/smartd.confcần thiết-d removable
Stuart Cardall

9

Câu trả lời được chấp nhận đề nghị sự táo bạo đó là yum install srvadmin-all. Blecch. Đây là cách làm cho nó bớt đi một chút (nhưng vẫn là blecch-y; tuy nhiên, bạn có thể gầy hơn nhiều trên nền tảng của HP. Nhưng tôi nghĩ vậy ...) Ý tôi là, chỉ cài đặt những thành phần cần thiết để quản lý lưu trữ trên máy của bạn .

BTW, câu trả lời trực tiếp cho câu hỏi của người dùng nằm trong mục "Hiển thị đĩa vật lý trên vdisk 0" trong danh sách bên dưới.

wget -q -O - http://linux.dell.com/repo/hardware/latest/bootstrap.cgi > bootstrap.cgi
bash bootstrap.cgi
yum install srvadmin-base
yum install srvadmin-storageservices

Thêm vào .bashrc gốc:

export PATH=$PATH:/opt/dell/srvadmin/bin

Thưởng thức:

Các lệnh RAID

  • Hiển thị tất cả các đĩa vật lý trên bộ điều khiển 0

    $ omreport storage pdisk controller=0
    
  • Hiển thị tất cả các đĩa logic trên bộ điều khiển 0

    $ omreport storage vdisk controller=0
    
  • Hiển thị tất cả các đĩa vật lý trên vdisk 0

    $ omreport storage pdisk controller=0 vdisk=0
    
  • Cấu hình lại một vdisk để được raid1 từ raid0 ( COOL !!!! )

    $ sudo omconfig storage vdisk action=reconfigure controller=0 vdisk=1 raid=r1 pdisk=0:0:2,0:0:3
    
  • Tạo một vdisk trên một đĩa mới:

    $ sudo omconfig storage controller controller=0 action=clearforeignconfig
    $ sudo omconfig storage controller controller=0 action=createvdisk raid=r0 size=max pdisk=0:0:2
    

Thêm thông tin

BTW, vì đây không gì khác hơn là thẻ LSI MegaCLI mang nhãn hiệu Dell, bạn có thể tìm thấy câu trả lời của Han Solo thậm chí còn tốt hơn! Tôi vẫn chưa thử nó, tuy nhiên.

Điều ngọt ngào nhất

Đây là một ví dụ về đầu ra của omreport, được dẫn qua grep để có một gói dữ liệu ngon:

$ omreport storage pdisk controller=0 vdisk=0 | grep -v ": Not "
List of Physical Disks belonging to root

Controller PERC H700 Integrated (Embedded)
ID                              : 0:0:0
Status                          : Ok
Name                            : Physical Disk 0:0:0
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFDT
Part Number                     : CN0X162K7262213800JTA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E44C5

ID                              : 0:0:1
Status                          : Ok
Name                            : Physical Disk 0:0:1
State                           : Online
Power Status                    : Spun Up
Bus Protocol                    : SAS
Media                           : HDD
Failure Predicted               : No
Revision                        : HT64
T10 PI Capable                  : No
Certified                       : Yes
Encryption Capable              : No
Capacity                        : 136.13 GB (146163105792 bytes)
Used RAID Disk Space            : 136.13 GB (146163105792 bytes)
Available RAID Disk Space       : 0.00 GB (0 bytes)
Hot Spare                       : No
Vendor ID                       : DELL(tm)
Product ID                      : ST9146852SS
Serial No.                      : 6TB1AFEY
Part Number                     : CN0X162K7262213800FPA01
Negotiated Speed                : 6.00 Gbps
Capable Speed                   : 6.00 Gbps
Sector Size                     : 512B
Manufacture Day                 : 05
Manufacture Week                : 10
Manufacture Year                : 2011
SAS Address                     : 5000C500395E3C1D

@slm Về chỉnh sửa của bạn- nó có thực sự hoạt động mà không cần root không? Tôi không có omreport / omconfig trước mặt tôi những ngày này, nhưng tôi không chắc bất kỳ người dùng nào cũng có thể tạo vdisk. '$' Trên dòng lệnh ngụ ý người dùng thông thường, không phải root.
Mike S

Vâng, tôi mới làm điều này vào một ngày khác khi tôi giao dịch với Dell 730 tất cả các cmd ngoại trừ 2 cái mà "tạo ra" không yêu cầu root, tôi sẽ sửa.
slm

6

Tôi cũng đang vật lộn để làm cho nó hoạt động trong CentOS và tôi đã tìm thấy một gói hoạt động ở đây http://mirror.ndchost.com/software/lsi/

được gọi là " MegaCli-8.07.10-1.noarch.rpm "

Tham chiếu lệnh http://hwear.le-vert.net/wiki/LSIMegaRAIDSAS

Tôi hy vọng nó sẽ giúp.


1
Tôi hoàn toàn đồng ý, sử dụng / opt / megacli / MegaCli64 -PDList -aALL | phần mềm grep -i và nó sẽ cho bạn biết nếu các đĩa vật lý ổn. (Lệnh là từ erikimh.com/megacli-chcoateet - hãy xem nếu tôi sử dụng sai). Về cơ bản, dịch vụ đột kích thực hiện rất tốt công việc giám sát các đĩa, vì vậy chỉ cần theo dõi ý kiến ​​của nó về trạng thái hoạt động của các đĩa.
Một số Linux Nerd

3
smartctl -d megaraid,00 -a /dev/sda
Got MegaRAID inquiry.. FUJITSU MBE2147RC       D906
Device: FUJITSU  MBE2147RC        Version: D906
Serial number: xxxx
Device type: disk
Transport protocol: SAS
Local Time is:

8
Vui lòng xem xét cách đọc Làm thế nào để tôi viết một câu trả lời tốt? trong trung tâm trợ giúp của chúng tôi và sau đó sửa lại Câu trả lời. Lệnh của bạn về mặt kỹ thuật có thể là một giải pháp, cũng đã được đề cập trong các câu trả lời khác, cũ hơn nhiều và một số lời giải thích được hoan nghênh. Cảm ơn trước.
HBruijn

1
Câu trả lời khác được sử dụng "sat + megaraid", không phù hợp với tôi. (Phải, tôi không biết rõ về lệnh smartctl và không biết cách thay đổi lệnh để làm cho nó hoạt động.) Câu trả lời này đã đưa tôi đi đúng hướng và nó hoạt động với tôi.
Yongwei Wu

1

Các percclilệnh cũng có thể hiển thị cho bạn rất nhiều thông tin ổ đĩa nếu bạn hỏi nó độc đáo:

# /opt/MegaRAID/perccli/perccli64 /c0/e32/s0 show all
Controller = 0
Status = Success
Description = Show Drive Information Succeeded.


Drive /c0/e32/s0 :
================

-------------------------------------------------------------------------
EID:Slt DID State DG       Size Intf Med SED PI SeSz Model            Sp
-------------------------------------------------------------------------
32:0      0 UGood -  278.875 GB SAS  HDD N   N  512B ST3300657SS      U
-------------------------------------------------------------------------

EID-Enclosure Device ID|Slt-Slot No.|DID-Device ID|DG-DriveGroup
DHS-Dedicated Hot Spare|UGood-Unconfigured Good|GHS-Global Hotspare
UBad-Unconfigured Bad|Onln-Online|Offln-Offline|Intf-Interface
Med-Media Type|SED-Self Encryptive Drive|PI-Protection Info
SeSz-Sector Size|Sp-Spun|U-Up|D-Down/PowerSave|T-Transition|F-Foreign
UGUnsp-Unsupported|UGShld-UnConfigured shielded|HSPShld-Hotspare shielded
CFShld-Configured shielded|Cpybck-CopyBack|CBShld-Copyback Shielded


Drive /c0/e32/s0 - Detailed Information :
=======================================

Drive /c0/e32/s0 State :
======================
Shield Counter = 0
Media Error Count = 0
Other Error Count = 0
Drive Temperature =  40C (104.00 F)
Predictive Failure Count = 1
S.M.A.R.T alert flagged by drive = Yes

Điều này cần phải được lặp lại cho từng khe bao vây, hoặc ít nhất tôi chưa tìm được cách in tất cả các khe đó cùng một lúc bằng một percclilệnh.

Nó cũng dễ cài đặt so với các tùy chọn khác, toàn diện hơn:

# curl -C - -O 'https://downloads.dell.com/FOLDER04470715M/1/perccli_7.1-007.0127_linux.tar.gz'
# tar xzvf ../perccli_7.1-007.0127_linux.tar.gz
# cd Linux/
# yum localinstall perccli-007.0127.0000.0000-1.noarch.rpm
# cd /opt/MegaRAID/perccli/

perccliKHÔNG một bộ giám sát toàn diện như Delll OMSA, nhưng nó có vẻ như nhiều folks không muốn một cái gì đó toàn diện và thay vào đó cần một công cụ khá đơn giản.


-1

Xin chào Tôi có thẻ Dell PERC / LSI tương tự và tôi cần kiểm tra trạng thái RAID. LSI có một tiện ích gọi là sas2ircu mà tôi thấy khá hữu ích, đó cũng là một phiên bản dành cho Windows và Linux.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.