Tw_cli của 3Ware có nghĩa là gì bởi một đĩa DEGRADED và so với EC EC-ERROR?


10

Tôi đã có một mảng RAID buồn trên thẻ 3ware 9650SE-16ML. Những gì tôi không thể nói là nếu tôi vừa bị lỗi hai đĩa (bummer!) Hoặc nếu tôi đọc sai. Sản lượng liên quan của /c0 show alllà:

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     DEGRADED         u0     931.51 GB   1953525168    5QJ07MAH            
p1     ECC-ERROR        u0     931.51 GB   1953525168    5QJ0DCW9            
p2     OK               u0     931.51 GB   1953525168    5QJ0DW9C            
p3     OK               u0     931.51 GB   1953525168    5QJ0CKXJ            

Và thất bại là (từ show alarms):

Ctl  Date                        Severity  Alarm Message
------------------------------------------------------------------------------
c0   [Sun Nov 20 07:47:23 2011]  INFO      Rebuild started: unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Drive ECC error reported: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Source drive error occurred: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Rebuild failed: unit=0
c0   [Sun Nov 20 08:20:12 2011]  INFO      Rebuild paused: unit=0

Tôi nghĩ rằng những gì đã xảy ra là p0 không thành công, và sau đó p1 có lỗi ECC (hay còn gọi là dữ liệu của tôi đã biến mất). Nhưng ... có lẽ không? Nó vẫn ở mức 97% được xây dựng lại, nhưng không thể vượt qua lỗi này.

Theo như tôi có thể nói, một quản trị viên trước đó đã tắt xác minh định kỳ, đó là điều đã đưa chúng tôi vào trạng thái này. Đây không phải là điều mà hầu hết mọi người nên lo lắng với RAID 3Ware của họ!

Cập nhật

Sau khi đánh bại nó trong vài ngày, tôi đã thực hiện bit IgnoreECC và nó được xây dựng lại, nhưng dữ liệu của tôi bị mất. Bummer.


Hãy thử phương pháp Freezer Recovery nếu có bất kỳ dữ liệu quan trọng nào về nó.
Chris S

Tôi không chống lại thủ thuật tủ đông, nhưng không phải là cho một chế độ thất bại cụ thể, không chỉ là "ổ đĩa của tôi đã chết"?
Bill Weiss

Đĩa có nhãn DEGRADED là đĩa đích của hoạt động REBUILD.
wazoox

Câu trả lời:


7

Lỗi ECC có nghĩa là có ít nhất một khu vực không thể đọc được trên ổ đĩa. Tuy nhiên, nếu bạn may mắn, khu vực đó thực sự có thể không được sử dụng bởi hệ thống tệp nằm trên ổ đĩa đó, do đó bạn vẫn có thể sao chép dữ liệu của mình từ mảng ở trạng thái này.

Ngoài ra còn có một số tùy chọn để bỏ qua lỗi ECC trong quá trình xây dựng lại:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

Tuy nhiên, sử dụng các tùy chọn này có nghĩa là dải RAID bị ảnh hưởng bởi một khu vực xấu sẽ bị hỏng (không chắc chắn chính xác thẻ sẽ làm gì trong trường hợp này - nó có thể thay thế toàn bộ dải bằng số không, hoặc thậm chí với dữ liệu ngẫu nhiên), do đó, mảng đã phục hồi có thể thực sự có tham nhũng không thể phát hiện (nếu dải bị ảnh hưởng nằm ở giữa một số tệp dữ liệu). Sao chép dữ liệu của bạn từ mảng sang một nơi khác trước khi cố gắng xây dựng lại có thể an toàn hơn (ít nhất bạn sẽ gặp lỗi khi cố gắng đọc khu vực xấu).

Bạn nên thiết lập xác minh theo lịch trình của mảng để bắt các khu vực không thể đọc được trước đó, để bạn có thể thay thế một ổ đĩa bắt đầu bị hỏng.


Bây giờ tôi đang thực hiện bit ignECC. Không tìm kiếm tuyệt vời cho dữ liệu của tôi.
Bill Weiss

1
Và, vâng, đôi khi chúng ta nên để các mảng xác minh. Tôi sẽ suy đoán rằng anh chàng đã thiết lập điều này đã tắt nó vì lý do hiệu suất :(
Bill Weiss

Vâng, điều đó đã thông qua việc xây dựng lại, nhưng không có dữ liệu của tôi. Bummer. Điều đó sẽ dạy chúng ta tắt xác minh ...
Bill Weiss

4

Tôi chưa bao giờ trải nghiệm ổ đĩa vật lý (p0) để chuyển sang trạng thái DEGRADED, tuy nhiên bạn có thể lấy lại ổ ECC-ERROR hoặc thậm chí ổ DEGRADED bằng cách xóa chúng qua

/c0 p1 remove

và sau đó phát hành quét lại

/c0 rescan

đưa họ trở lại đơn vị đột kích thông qua

maint rebuild c0 u0 p1

Ổ đĩa SATA khiến tôi thất bại với ECC-ERROR tôi đã có thể hồi sinh nếu thậm chí chỉ trong vài giờ trước khi thất bại một lần nữa.


3
Loại bỏ ổ đĩa p1 ở trạng thái hiện tại sẽ có khả năng vòi hoàn toàn mảng.
Serge Vlasov

Tôi đã làm điều này với ổ đĩa p0 (với giả định rằng đó là ổ đĩa xấu) và nó đang cố gắng xây dựng lại, nhưng nó đã đánh dấu ổ đĩa là DEGRADED gần như ngay lập tức. Bummer.
Bill Weiss

1
AFAIR, ổ đĩa được giữ dấu là DEGRADED trong quá trình xây dựng lại - xem, ví dụ, ở đây . Điều quan trọng là trạng thái mảng (TÁI TẠO hay cái gì khác?).
Serge Vlasov

Hừm. Thực tế nó đang được xây dựng lại ... Tất cả bốn ổ đĩa đều nhấp nháy rất nhiều, đó là một dấu hiệu tốt, phải không?
Bill Weiss

Stiiiiiil xây dựng lại ... nó ở mức 37% sau 4 giờ. Bummer.
Bill Weiss

2

Rất có khả năng dữ liệu của bạn đã biến mất. Lỗi ECC có nghĩa là một lỗi không thể phục hồi trong khi đọc từ đĩa này.

Nếu bạn chưa có bản sao lưu, bạn có thể thử kết xuất trạng thái hiện tại của mảng. Điều này có thể có thể bởi vì bộ điều khiển không biết liệu nó có bị mất dữ liệu hay chỉ là một vùng trống (nó thiếu bất kỳ cái nhìn sâu sắc nào về hệ thống tệp).

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.