Vật lý Xác định ổ cứng bị lỗi


25

Vì vậy, giả sử máy chủ của bạn có 6 ổ cứng. Một ổ đĩa bị lỗi (sẽ không gắn kết / phát hiện, rơi ra khỏi cuộc đột kích có lỗi) hoặc bị lỗi (SMART trở nên tồi tệ hơn, v.v.). Bạn cần trao đổi ổ đĩa xấu. Khi bạn mở trường hợp bạn thấy .. sáu ổ cứng giống hệt nhau.

Làm thế nào bạn có thể biết cái nào không còn khỏe / gắn / hoạt động?

Hệ thống sẽ là linux, rất có thể là máy chủ Ubuntu, sử dụng tối đa RAID phần mềm đơn giản. Các ổ đĩa cứng sẽ là SATA và được kết nối trực tiếp với bo mạch chủ. (không có bộ điều khiển đột kích)

Tôi không muốn ngắt kết nối ngẫu nhiên các ổ đĩa cho đến khi tôi chọn đúng ổ đĩa. Các ổ đĩa đều xuất hiện giống hệt tôi; Tôi tưởng tượng có một số cách phổ biến để xác định ổ đĩa nào mà tôi không biết. Có ai có bất kỳ con trỏ / lời khuyên / thực hành tốt nhất? Cảm ơn!

EDIT: Tôi đã muốn điều này được 'khái quát hóa' theo kiểu lượn sóng bằng tay, nhưng nó chỉ xuất hiện dưới dạng 'không hoàn chỉnh' và 'khủng khiếp'. Lỗi của tôi!


4
Nếu bạn phải tắt máy và tìm ra ổ cứng nào là cái gì, bạn nên dành thời gian trong khi máy ngừng hoạt động để xác định từng ổ cứng và dán nhãn theo cách nào đó để điều này xảy ra lần nữa, bạn không có điều này vấn đề.
Roy Rico

2
Một "RAID (hoặc bất cứ điều gì)"? Âm thanh như người dùng thả lỏng trong phòng máy.
romandas

1
Một máy chủ phù hợp sẽ cho bạn biết ổ đĩa nào bằng cách bật chỉ báo lỗi ổ đĩa của ổ đĩa xấu.
John Gardeniers

8
Mọi người ơi, mọi người nhanh chóng nhảy vào chuyện này như thể không được ... thật lòng mà nói tôi nghĩ đó là một câu hỏi hay, một câu hỏi mà tôi phải tự giải quyết!
Mark Henderson

2
Tôi tò mò liệu ở đó, vì mục đích sở thích, bằng cách nào đó có thể xây dựng (với hàn sắt trong tay và vân vân) để điều khiển đèn LED để nhận dạng chúng từ bên trong một hệ điều hành ngẫu nhiên (khi không có bộ điều khiển đột kích / đĩa cấp máy chủ tốt có mặt để làm phép thuật của họ) ...
Oskar Duveborn

Câu trả lời:


26

Tôi đã có vấn đề chính xác này trên một máy chủ (tháp) giống như bạn giải thích, và thật dễ dàng:

smartctl sẽ xuất số sê-ri của ổ đĩa

Các nhà cung cấp đôi khi vận chuyển các công cụ cụ thể của riêng họ, như hdparm, cũng sẽ làm như vậy.

Vì vậy, hãy xuất chuỗi nối tiếp của ổ đĩa xấu, sau đó sử dụng gương của nha sĩ và đèn pin để tìm ổ đĩa.

Trên giá đỡ, bạn sẽ thường có đèn báo như những người khác đã nói, nhưng tôi cá là điều tương tự sẽ được áp dụng.


Rất tiếc ... smartctl, không phải hdparm là người tôi nghĩ đến. Tôi cần chỉnh sửa câu trả lời của mình để phản ánh điều đó.
Bart Silverstrim

nâng cấp để nhắc nhở tôi về lệnh đúng :-)
Bart Silverstrim

1
hdparm -i cho tôi xem số sê-ri của các ổ đĩa của tôi - Tuy nhiên, đó có thể là phản hồi dành riêng cho nhà cung cấp
Ian Clelland

1
Xuất sắc! Tôi không thể thử ngay bây giờ nhưng có vẻ như đây là câu trả lời! Bây giờ tôi sẽ gắn nhãn ổ đĩa cứng của mình với N chữ số cuối của số sê-ri của chúng (giả sử đây là duy nhất, trên mỗi máy chủ) ở một nơi được hiển thị trong khi gắn. Ngoài ra, từ việc googling, lệnh có vẻ là "smartctl -i"
privatehuff

15

Đặt nhãn dán vào ổ đĩa (tùy thuộc vào thiết kế của khay) có thể không khả thi. Vào thời điểm ổ đĩa chết, nhãn dán có thể bị khô và rơi ra.

ledctl (từ gói ledmon) thực sự là cách để đi với điều này.

ledctl locate=/dev/disk/by-id/[drive-id]

hoặc là

ledctl locate=/dev/sda

sẽ chiếu sáng ổ đĩa không sáng trên khung của bạn cho ổ đĩa được chỉ định. Tôi đã cung cấp hai ví dụ để minh họa rằng việc bạn xác định ổ đĩa không thành vấn đề. Bạn có thể sử dụng nối tiếp, tên, v.v ... Bất kỳ thông tin nào có sẵn cho bạn đều có thể được sử dụng. Các ổ đĩa được tham chiếu theo nhiều cách trong đường dẫn / dev / và / dev / đĩa /.

Để tắt đèn trở lại, chỉ cần thực hiện lại, thay đổi định vị thành location_off như vậy:

ledctl locate_off=/dev/sda

6

Thông thường bạn sẽ phải hy vọng rằng các kết nối được dán nhãn theo cách nào đó sau đó hoạt động từ danh tính của thiết bị bị lỗi. Ví dụ ... và ai đó sẽ phải nhận xét để sửa lỗi cho tôi ... nếu bạn có hai kênh IDE, mỗi kênh có tối đa 2 ổ đĩa, bạn có thể có sda, sdb, sdc và sdd. Nếu sdd thất bại, nó sẽ là ổ đĩa thứ hai trên cáp của kênh IDE thứ hai.

Nếu đó là SATA và giống như hệ thống tôi có ở phòng sau, các cổng được gắn nhãn cho mỗi ổ đĩa sata. Một lần nữa, ký tự ổ đĩa đi từ thông qua bất cứ thứ gì các ổ đĩa đi lên, bắt đầu từ cổng 0 của các đầu nối SATA và di chuyển lên.

Nếu có bất kỳ sự khác biệt trong sản xuất, dmesg | grep sd hoặc dmesg | grep hd sẽ mang lại một số manh mối.

Nếu bạn có sẵn số sê-ri, tôi nghĩ lệnh hdparm có thể cung cấp cho bạn trong phần mềm để bạn có thể theo dõi theo cách đó. Bạn có thể muốn gắn nhãn ổ đĩa ở đâu đó nếu đó là trường hợp vì vậy bạn không phải lo lắng về điều đó khi bạn thấy có vấn đề.

... Tôi biết có một lý do khác khiến tôi thích RAID phần cứng hơn RAID phần mềm ... đèn mờ. Thực sự thích những ánh đèn mờ.

EDIT: smartctl, không phải hdparm, cung cấp số sê-ri. Lỗi của tôi.


+1 cho đèn mờ
Oskar Duveborn

3

Một số ổ đĩa hiển thị "tệp" định vị trong /sysđó bạn có thể lặp lại 1 để bật đèn chỉ thị định vị hoặc 0 để tắt.

$ for light in $( find /sys -name "locate" ) ; do echo 1 > $light ; sleep 10 ; echo 0 > $light; done

Tôi không có ý kiến ​​về việc này! Điều đó thật tuyệt!
diq

2

Sáu HDDS nội bộ? Nếu chúng là ổ đĩa trao đổi bên ngoài, nóng, nhà cung cấp dịch vụ trao đổi nóng có thể có đèn báo lỗi để giúp bạn xác định ổ đĩa xấu. Ngoài ra, nhiều chương trình quản lý Raid có một tùy chọn để nháy đèn trên một ổ đĩa cụ thể để xác định đó là cái nào. Nếu tất cả chúng đều không có đèn, thì bạn sẽ xuống phần mềm RAID cho bạn biết ID nào là tốt và nhìn vào ID SCSI, v.v. để tìm ra nó. Nếu chúng được đặt thành tự động, thì tài liệu bộ điều khiển RAID của bạn sẽ cho bạn biết thứ tự nào trong chuỗi SCSI mà ID được gán. Chúc may mắn. Hãy sao lưu ngay bây giờ trong khi mọi thứ vẫn đang chạy!


2

Ít nhất, phần mềm / bộ điều khiển RAID đã cho bạn biết về ổ đĩa bị lỗi sẽ cho bạn biết ổ đĩa nào bị lỗi (số id). 0 thường là cái ở trên cùng bên trái, di chuyển xuống, sau đó sang bên phải (nếu trong hai hoặc nhiều cột). Các cổng có thể được dán nhãn.


2

Đối với câu trả lời ngắn - "lsscsi" Đối với câu trả lời chi tiết - "đĩa lshw -c" ​​sẽ hiển thị cho bạn các cổng HDD và SATA trong đó các cổng được kết nối.


2

Nếu bạn không có đèn định vị và không thể dễ dàng tìm thấy các số sê-ri ở bên ngoài các ổ đĩa, đôi khi kỹ thuật này có thể giúp: tạo RẤT NHIỀU hoạt động trên ổ đĩa cụ thể đó và sau đó tìm ổ đĩa với đèn LED hoạt động ở trạng thái rắn . Tốt nhất là theo dõi với một kiểm tra chi tiết hơn về số sê-ri, nhưng điều này có thể giúp thu hẹp tìm kiếm.

Ví dụ:

# while true; do dd if=/dev/disk/by-id/scsi-drive-that-is-dying of=/dev/null; sleep 1; done

(Vòng lặp while không cần thiết về mặt kỹ thuật, nhưng nó sẽ giữ mọi thứ chuyển động trong khi bạn đi đến trung tâm dữ liệu. "Ngủ 1" giúp tránh việc sử dụng CPU cao được tạo bởi vòng lặp nhanh nếu "dd" không thành công do nói .. . Ổ đĩa bị ngắt kết nối.)


1

Khi thất bại, bạn có thể xác định các ổ đĩa không bị lỗi và hoạt động ngược.

find / -type f -exec cat {} \; >> /dev/null

Bất cứ ổ đĩa nào hoạt động, đèn KHÔNG hoạt động đều có khả năng xấu (và hy vọng nó chỉ là một.) Lưu ý rằng nếu bạn có cấu hình phụ tùng nóng, chúng sẽ không sáng.


0

Chúng phải được dán nhãn trên khung và tương ứng với Phần mềm RAID.

Trên Dell của chúng tôi, không phải là cách bạn sẽ nghĩ. Trên 0: 0 của chúng tôi là dưới cùng bên trái, 0: 1 là trên cùng bên trái, 0: 2 là giữa dưới cùng, v.v. Trong tất cả các máy chủ tôi đã sử dụng (ngoại trừ công việc tự chế), phần mềm RAID sẽ chỉ ra cổng và nó sẽ dán nhãn.


0

scsirastools có một bộ công cụ cho phép bạn thực hiện các xét nghiệm chẩn đoán khác nhau trên các đĩa SCSI. Bạn cũng có thể sử dụng sgmon để tắt nguồn đĩa dưới sự kiểm soát của phần mềm. Điều này ít nhất sẽ cho phép bạn xác định đĩa vật lý của bạn có thể xác định vị trí của nó với chẩn đoán.

Nếu bạn có bộ điều khiển RAID phần cứng, BIOS hoặc phần mềm quản lý của bộ điều khiển sẽ có một phương tiện cho phép bạn xác định các đĩa xấu.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.