Tôi đã có một mảng RAID buồn trên thẻ 3ware 9650SE-16ML. Những gì tôi không thể nói là nếu tôi vừa bị lỗi hai đĩa (bummer!) Hoặc nếu tôi đọc sai. Sản lượng liên quan của /c0 show all
là:
Port Status Unit Size Blocks Serial
---------------------------------------------------------------
p0 DEGRADED u0 931.51 GB 1953525168 5QJ07MAH
p1 ECC-ERROR u0 931.51 GB 1953525168 5QJ0DCW9
p2 OK u0 931.51 GB 1953525168 5QJ0DW9C
p3 OK u0 931.51 GB 1953525168 5QJ0CKXJ
Và thất bại là (từ show alarms
):
Ctl Date Severity Alarm Message
------------------------------------------------------------------------------
c0 [Sun Nov 20 07:47:23 2011] INFO Rebuild started: unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Drive ECC error reported: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Source drive error occurred: port=1, unit=0
c0 [Sun Nov 20 08:20:12 2011] ERROR Rebuild failed: unit=0
c0 [Sun Nov 20 08:20:12 2011] INFO Rebuild paused: unit=0
Tôi nghĩ rằng những gì đã xảy ra là p0 không thành công, và sau đó p1 có lỗi ECC (hay còn gọi là dữ liệu của tôi đã biến mất). Nhưng ... có lẽ không? Nó vẫn ở mức 97% được xây dựng lại, nhưng không thể vượt qua lỗi này.
Theo như tôi có thể nói, một quản trị viên trước đó đã tắt xác minh định kỳ, đó là điều đã đưa chúng tôi vào trạng thái này. Đây không phải là điều mà hầu hết mọi người nên lo lắng với RAID 3Ware của họ!
Cập nhật
Sau khi đánh bại nó trong vài ngày, tôi đã thực hiện bit IgnoreECC và nó được xây dựng lại, nhưng dữ liệu của tôi bị mất. Bummer.