Bộ cài đặt RAID6 Areca 1280ml không thành công


10

Hôm nay chúng tôi gặp một số trường hợp xấu nhất và mở ra cho bất kỳ loại ý tưởng tốt.

Đây là vấn đề của chúng tôi:

Chúng tôi đang sử dụng một số máy chủ lưu trữ chuyên dụng để lưu trữ các máy ảo của mình. Trước khi tôi tiếp tục, đây là thông số kỹ thuật:

  • Máy chủ chuyên dụng
  • Bộ điều khiển RAID Areca 1280ml, Phần sụn 1.49
  • 12x ổ cứng Samsung 1TB

Chúng tôi đã cấu hình một bộ RAID6 với 10 đĩa chứa một ổ đĩa logic. Chúng tôi có hai phụ tùng nóng trong hệ thống.

Hôm nay một ổ cứng bị lỗi. Điều này xảy ra theo thời gian, vì vậy chúng tôi thay thế nó. Khi xây dựng lại một đĩa thứ hai không thành công. Thông thường điều này là không vui. Chúng tôi đã dừng các hoạt động IO nặng để đảm bảo xây dựng lại RAID ổn định.

Đáng buồn là đĩa nóng dự phòng thất bại trong khi xây dựng lại và toàn bộ điều dừng lại.

Bây giờ chúng ta có tình huống sau:

  • Bộ điều khiển nói rằng bộ đột kích đang được xây dựng lại
  • Bộ điều khiển nói rằng âm lượng không thành công

Đó là một hệ thống RAID 6 và hai đĩa bị lỗi, vì vậy dữ liệu phải còn nguyên vẹn, nhưng chúng tôi không thể đưa âm lượng trực tuyến trở lại để truy cập dữ liệu.

Trong khi tìm kiếm, chúng tôi tìm thấy các khách hàng tiềm năng sau đây. Tôi không biết họ tốt hay xấu:

  1. Phản chiếu tất cả các đĩa vào một bộ ổ đĩa thứ hai. Vì vậy, chúng tôi sẽ có khả năng thử những thứ khác nhau mà không mất nhiều hơn những gì chúng tôi đã có.

  2. Đang cố gắng xây dựng lại mảng trong R-Studio. Nhưng chúng tôi không có kinh nghiệm thực sự với phần mềm.

  3. Kéo tất cả các ổ đĩa, khởi động lại hệ thống, thay đổi thành bios bộ điều khiển areca, lắp lại từng ổ cứng một. Một số người đang nói rằng việc đưa hệ thống trực tuyến bằng cách này. Một số người nói rằng hiệu quả bằng không. Một số người nói rằng họ đã thổi bay toàn bộ.

  4. Sử dụng các lệnh areca không có giấy tờ như "giải cứu" hoặc "LeVel2ReScUe".

  5. Liên hệ với một dịch vụ pháp y máy tính. Nhưng whoa ... ước tính chính qua điện thoại vượt quá 20.000 €. Đó là lý do tại sao chúng tôi vui lòng yêu cầu giúp đỡ. Có lẽ chúng ta đang thiếu điều hiển nhiên?

Và tất nhiên, chúng tôi có bản sao lưu. Nhưng một số hệ thống bị mất một tuần dữ liệu, đó là lý do tại sao chúng tôi muốn hệ thống hoạt động trở lại.

Bất kỳ trợ giúp, đề xuất và câu hỏi đều được chào đón.


3
Tôi sẽ lập luận rằng bất cứ điều gì bạn làm, bước đầu tiên của bạn phải là một ddtấm gương phản chiếu tất cả các đĩa, chỉ để ngăn ngừa thiệt hại nhiều hơn và có kế hoạch dự phòng khi làm việc trên một giải pháp thực sự.
Sven

Chúng tôi sẽ làm điều này ...
Richard

1
Còn các điểm nóng thì sao?
Cawflands

1
Bạn có thể liên hệ với nhà cung cấp để được hỗ trợ? Giả sử bạn không thể (và bạn đã sử dụng dd để phản chiếu mọi thứ, theo đề xuất tuyệt vời của @ SvenW), tại sao không thay thế các ổ đĩa bị lỗi, khởi động lại và xem điều gì xảy ra? Tôi không nhất thiết phải kéo tất cả các ổ đĩa, chỉ những ổ đĩa bị lỗi. Nhưng thực sự, đặt cược đầu tiên của bạn là nhà cung cấp, họ hiểu phần mềm của họ.
Jeremy

Bạn đã tìm ra một giải pháp? Nếu vậy hãy cho chúng tôi biết những gì nó đã được tham khảo trong tương lai!
Cấp

Câu trả lời:


2

Tôi nghĩ Lựa chọn 1. là tốt nhất của bạn.

Lấy 12x ổ cứng mới, 1x bộ điều khiển RAID mới Hãy thử nhân bản (dd if = of =) ổ đĩa cũ sang ổ đĩa mới 1: 1 bằng bất kỳ hộp linux nào. Xây dựng một máy chủ mới bằng bộ điều khiển RAID mới 1x và ổ cứng mới 12 lần

Cố gắng xây dựng lại mảng trong máy chủ mới. Sự thành công? Tuyệt quá. Dừng lại.
Xây dựng lại thất bại? Phản chiếu các đĩa cũ sang đĩa mới một lần nữa, hãy thử Tùy chọn i + 1


0

Đây là một kịch bản rất phổ biến không may. Có một nghiên cứu tốt của Google về những năm trước đây và hóa ra việc mất dữ liệu với RAID có thể xảy ra trong quá trình xây dựng lại mảng. Điều này có thể tác động đến các hệ thống RAID khác nhau với mức độ nghiêm trọng khác nhau. Đây là kịch bản RAID6:

  • mảng của bạn có 3 dữ liệu và 2 đĩa chẵn lẻ.
  • nếu bạn mất một đĩa, chắc chắn rằng tất cả dữ liệu đều có thể phục hồi được.
  • nếu bạn mất 2 đĩa, bạn sẽ mất dữ liệu

Tại sao vậy?

Hãy suy nghĩ về những điều sau: hãy có một số dữ liệu, giả sử 3 khối đầu tiên của tệp bạn có các khối dữ liệu sau: A1 + A2 + A3 và chẵn lẻ sau: Ap + Ap ngồi trên hdd1 ... hdd5

Nếu bạn mất bất kỳ hai đĩa nào trong khoảng từ 1 đến 3 thì bạn đã mất dữ liệu vì dữ liệu không thể phục hồi được, bạn có 2 khối dữ liệu chẵn lẻ và 1 khối dữ liệu.

Bây giờ cùng một kịch bản với 10 đĩa có thể khác nhau, nhưng tôi đoán nó đã xử lý giống như cách bạn chia dữ liệu thành 8 khối và lưu chẵn lẻ vào 2 ổ đĩa khác và có 2 phụ tùng nóng. Bạn có biết chi tiết về cấu hình bộ điều khiển RAID của bạn không?

Tôi sẽ bắt đầu khôi phục từ sao lưu ngoại vi (tôi đoán bạn có một số) và dịch vụ đã quay lại cố gắng khôi phục càng nhiều dữ liệu càng tốt, sử dụng Unix và dd các ổ đĩa thành hình ảnh và sử dụng nó làm thiết bị lặp.

http://wiki.edseek.com/guide:mount_loopback

Bạn cần biết loại siêu dữ liệu nào mà bộ điều khiển RAID sử dụng và nếu bạn may mắn thì nó được hỗ trợ trong một số công cụ như sợ.

Nhưng điều này không có nghĩa là bạn hoàn toàn có thể khôi phục dữ liệu, vì các tệp được phân phối giữa nhiều khối thông thường, việc khôi phục có thể không mang lại bất kỳ dữ liệu nào của bạn.

Tìm hiểu thêm về RAID:

https://ston.wiki.kernel.org/index.php/RAID_setup

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.