Khôi phục từ một mảng RAID bị thủng


10

đây là tình huống của tôi

Tôi có Máy chủ Dell với bộ điều khiển Dell Perc 7i, (Bộ điều khiển LSI).

Tôi đã có một ổ đĩa cho tôi một cảnh báo Dự đoán thất bại vì vậy tôi đã gọi cho bộ phận hỗ trợ của họ và họ đã ra và thay thế ổ đĩa và mảng được xây dựng lại, tiêu chuẩn khá.

Hai tuần sau, tôi có một ổ đĩa khác đưa cho tôi cảnh báo Dự đoán Thất bại. Tôi đoán có thể đó là một loạt các ổ đĩa hoặc sự trùng hợp tồi tệ, v.v. Vì vậy, tôi liên hệ với bộ phận hỗ trợ và tìm hiểu sâu hơn. Tôi nhận ra rằng có những khối xấu trên một trong những ổ đĩa khác không bị lỗi và những khối xấu đó đã được sao chép trong quá trình xây dựng lại. Vì vậy, bây giờ tôi có các khối xấu ở khắp mọi nơi và chúng đang dần giết chết mảng của tôi. Tôi đã đến để thấy rằng cái này được gọi là Mảng bị thủng.

Vì vậy, lời khuyên của họ là thay thế tất cả các ổ đĩa, xây dựng lại mảng và khôi phục từ bản sao lưu. Ngoại trừ tôi đã gặp sự cố này trong một vài tuần, điều đó có nghĩa là các bản sao lưu của tôi rất tệ ... và nếu tôi khôi phục từ bản sao lưu từ trước đó (một tháng trước) thì tôi sẽ bị mất khoảng 4 tuần dữ liệu từ cơ sở dữ liệu của mình. là hoàn toàn không thể chấp nhận cho văn phòng của chúng tôi.

Câu hỏi của tôi là ... có ai đã từng phục hồi từ một thứ như thế này mà không phải mất dữ liệu hoặc không có toàn bộ (ném tất cả ra ngoài cửa sổ và bắt đầu lại) không?

Tôi đã tìm thấy một liên kết bao trùm kịch bản của mình, không chắc nó có làm sáng tỏ tình huống nào không: http://www.theprojectbot.com/ston/what-is-a-puncured-ston-array/

Bất kỳ trợ giúp hoặc hướng sẽ được đánh giá cao! các bạn nghĩ sao?

Câu trả lời:


15

Hệ thống của bạn tôi cho rằng vẫn còn hoạt động, vì vậy, điều tốt nhất cần làm là tạo một bản sao lưu ngay lập tức , kết xuất các đĩa / mảng, xây dựng lại và khôi phục từ bản sao lưu.

Khối xấu không phải lúc nào cũng có nghĩa là sao lưu của bạn cũng xấu. Nếu bạn chưa gặp bất kỳ vấn đề về hiệu suất hoặc các tệp bị hỏng, thì các bản sao lưu của bạn vẫn phải đủ hoàn thành để hoàn tất khôi phục.

Để kiểm tra, hãy lấy bản sao lưu gần đây nhất của bạn và kiểm tra dữ liệu quan trọng nhất của bạn. Nếu nó vẫn còn nguyên vẹn, bạn có thể có một bản sao lưu tốt.

Tại thời điểm này, có một rủi ro liên quan vì bạn không thể chắc chắn 100% rằng các bản sao lưu của bạn là tốt hoặc sao lưu bây giờ sẽ không gây mất tập tin. Tuy nhiên, mảng của bạn cuối cùng sẽ thất bại và buộc khôi phục lại, vì vậy đây là tùy chọn thực sự duy nhất của bạn.


Tôi thấy, ngay bây giờ mọi thứ dường như đang hoạt động tốt. Vì vậy, nếu tôi có thể tạo một bản sao lưu hoàn chỉnh cho hệ thống của mình ngay bây giờ và tôi thay thế các ổ đĩa, xây dựng lại mảng và khôi phục lại bản sao lưu hoàn chỉnh đó ... tôi có nguy cơ thất bại này không? Hay tôi nên cài đặt lại HĐH và Phần mềm và chỉ khôi phục cơ sở dữ liệu để giảm thiểu rủi ro?
user72593

Các khối xấu thường không xảy ra ở cấp độ tệp. Tôi chỉ làm điều này nếu bạn tìm thấy các tập tin bị hỏng.
Nathan C

@NathanC Bạn không nhận được "khối xấu", bạn nhận được dữ liệu bị hỏng.
JamesRyan

@ user72593 Chỉ vì bạn có thể sao lưu các tệp ngày hôm nay không có nghĩa là chúng sẽ không bị thiếu các bộ phận. Cách duy nhất để xem những gì tốt hay không là so sánh nó với các bản sao lưu.
JamesRyan

1
@JamesRyan "Các khối xấu" có thể ở bất kỳ đâu trong đĩa, bao gồm trao đổi, tệp tạm thời hoặc trước đây được sử dụng nhưng không gian chưa sử dụng. Khi một ổ đĩa có khối xấu, nó không luôn luôn dữ liệu trung bình đã bị mất.
Nathan C

8

Ngay lập tức, hãy làm như sau:

  • Dừng quay sao lưu hoặc xóa cái cũ cho hệ thống này. Bạn muốn giữ tất cả các bản sao lưu mà bạn hiện có.
  • Hãy sao lưu toàn bộ máy chủ.

Hy vọng rằng các đĩa vẫn đủ tốt để dữ liệu của bạn còn nguyên vẹn và bạn sẽ không gặp phải bất kỳ sự cố nào khi chạy bản sao lưu đầy đủ mới.

Sau đó loại bỏ các đĩa đó và xây dựng một mảng RAID mới. Khi đã sẵn sàng, hãy thử khôi phục từ bản sao lưu bạn vừa mới lấy. Với bất kỳ may mắn nào, đó sẽ là tất cả những gì bạn cần làm.

Nếu thất bại, hãy thử bản cũ nhất và bản cũ nhất tiếp theo, v.v. Hãy chắc chắn kiểm tra chức năng của hệ thống - chỉ vì nó khởi động, không có nghĩa là nó hoạt động hoàn toàn. Đặc biệt, kiểm tra cơ sở dữ liệu cho tham nhũng.

Nếu bạn phải khôi phục toàn bộ hệ thống từ bản sao lưu cũ hơn, thì không sao. Lấy các bản sao lưu mới nhất và chỉ khôi phục các tệp cơ sở dữ liệu và các tệp quan trọng khác. Kiểm tra chúng để đảm bảo chúng hoạt động đúng. Một lần nữa, nếu thất bại, hãy thử cái cũ nhất tiếp theo.

Sử dụng quá trình này giảm thiểu việc mất dữ liệu.


Tôi thấy, đó là câu trả lời cho câu hỏi của tôi. Vì vậy, miễn là bản sao lưu của tôi còn nguyên vẹn thì tôi vẫn ổn, nếu không, thì ... tôi phải giải quyết nó. Cảm ơn.
user72593

4

Các câu trả lời do Grant và Nathan C cung cấp rất có liên quan đến cách bạn nên tiến hành xử lý các bản sao lưu / khôi phục và giải quyết tính toàn vẹn dữ liệu.

Dưới đây là một số chi tiết rõ ràng hơn về cách xử lý bộ RAID khi đến lúc phải tạo lại đĩa ảo và khôi phục từ bản sao lưu:

  • Xác minh rằng bạn có một bản sao lưu tốt của dữ liệu
  • Xóa đĩa ảo hiện có; Tất cả các đĩa sẽ hiển thị ở trạng thái "sẵn sàng" sau đó
  • Tái tạo một đĩa ảo mới; Cài đặt được đề xuất: đọc trước thích ứng, ghi lại và bộ nhớ đệm đĩa bị vô hiệu hóa
  • Bạn nên có một Đĩa ảo trực tuyến đang tiến hành khởi tạo nền.
  • Tiến hành khôi phục từ bản sao lưu; Khởi tạo nền thường chạy khoảng 600GB / giờ cho các trục chính 7.2K, vì vậy hãy khởi động lại nếu khôi phục sao lưu của bạn có thể chạy nhanh hơn thế, nếu không phần mềm sao lưu của bạn có thể gặp một số vấn đề với độ trễ ghi khi không có không gian mới ngay lập tức khôi phục.

Lưu ý : Nếu bạn đã sử dụng RAID5, bạn nên cân nhắc NGHIÊM TÚC khi sử dụng RAID6 lần này. RAID5 không đáng tin cậy cho dữ liệu quan trọng trong kinh doanh theo các thông lệ tốt nhất theo tiêu chuẩn ngành hiện hành trên một mảng có kích thước này. Các đĩa SATA / NL-SAS dung lượng lớn cũng có nguy cơ gặp phải URE cao hơn trong quá trình xây dựng lại, điều này dẫn đến việc đâm thủng như cách bạn đang xử lý. RAID6 giảm đáng kể rủi ro này và thường được chấp nhận đối với dữ liệu quan trọng với dung lượng ổ đĩa hiện có.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.