Làm thế nào để phục hồi từ lỗi ổ đĩa trong cấu hình RAID 5?


15

Sáng nay một ổ đĩa bị lỗi trên máy chủ cơ sở dữ liệu của chúng tôi. Mảng ổ đĩa (3 đĩa) được thiết lập trong cấu hình RAID 5.

Trong khi chúng tôi chờ đợi một sự thay thế ổ đĩa, chúng tôi đang chuẩn bị cho một chiến lược phục hồi. Người dùng đang tiếp tục làm việc trên hệ thống, mặc dù rất chậm (không biết tại sao ??).

Làm thế nào để một người cài đặt ổ đĩa mới - dữ liệu cho ổ đĩa này sẽ tự động được xây dựng lại từ tính chẵn lẻ hay chúng ta nên làm theo quy trình khác?

Chỉnh sửa: Đây là bộ điều khiển RAID phần cứng. (Cảm ơn câu trả lời cho đến nay, đánh giá cao)


4
Nhân tiện, thời gian để quyết định phải làm gì nếu một ổ đĩa bị lỗi trên một máy chủ quan trọng là trước khi một ổ đĩa bị lỗi trên một máy chủ quan trọng.
David Schwartz

Câu trả lời:


15

Hệ thống đang chạy rất chậm vì phải xây dựng lại dữ liệu còn thiếu liên quan đến CPU và I / O bổ sung.

Nếu bạn có một đĩa bị thiếu trong cấu hình RAID-5, bạn không có chiến lược khôi phục . Nếu một đĩa khác bị hỏng, bạn sẽ mất dữ liệu của mình . Chạy, không đi bộ, đến nhà cung cấp gần nhất mà bạn có thể nhận được một phần tương thích được bảo hành bởi nhà sản xuất được vận chuyển bởi một chuyển phát nhanh khẩn cấp cùng ngày. Nếu nhà cung cấp mà bạn đã mua mảng từ đó đang trong quá trình lấy phần, hãy lấy cả hai phần và bỏ phần còn lại làm phụ tùng.

Nếu bạn có RAID-5 đang được sử dụng cho một hệ thống sản xuất, bạn nên xem xét để lại một đĩa dự phòng trong mảng dưới dạng dự phòng nóng.

Đã thêm - Nếu nhật ký của bạn không nằm trên một ổ đĩa riêng (các đĩa riêng biệt), hãy di chuyển chúng sang một bộ đĩa riêng, thậm chí chỉ là một cặp được nhân đôi. Đây cũng sẽ là một chiến thắng hiệu suất nếu cơ sở dữ liệu của bạn có bất kỳ tải trọng đáng kể nào vì sự tranh chấp về khối lượng nhật ký có ảnh hưởng xấu không tương xứng đến hiệu suất.

Nếu điều này là có thể, bạn cũng có thể làm cho cơ sở dữ liệu của mình mạnh mẽ hơn bằng cách làm như sau:

  1. Tắt cơ sở dữ liệu.
  2. Sao lưu cơ sở dữ liệu.
  3. Di chuyển các bản ghi vào một bộ đĩa vật lý riêng biệt (đảm bảo bạn cấu hình lại cơ sở dữ liệu để nó biết nơi các bản ghi đã được di chuyển đến).
  4. Khởi động lại cơ sở dữ liệu và ứng dụng.

Nếu bạn có các bản ghi trên một ổ đĩa riêng, bạn có thể khôi phục và chuyển tiếp từ bản sao lưu nếu và chỉ khi một lỗi đĩa không làm ảnh hưởng đến các bản ghi. Nhật ký cơ sở dữ liệu phải nằm trên một ổ đĩa riêng vì (trong số những lý do khác) vì những lý do sau:

  • Các mẫu sử dụng nhật ký chủ yếu là tuần tự, nối thêm các mục nhật ký vào cuối tệp (tệp có hiệu lực là bộ đệm vòng). Điều này có nghĩa là một số lượng lớn các mục nhật ký có thể được viết ra một cách nhanh chóng vì có ít hoạt động tìm kiếm đầu đĩa.

  • Nếu họ đang chia sẻ các đĩa vật lý với khối lượng công việc truy cập ngẫu nhiên lớn (ví dụ: bảng và chỉ mục giao dịch), họ sẽ bị chậm lại một cách không tương xứng khi hoạt động tìm kiếm đầu làm gián đoạn việc ghi tuần tự.

  • Có các bản ghi trên một khối riêng biệt hầu như luôn luôn là một chiến thắng hiệu suất và chỉ cần một cặp nhân đôi duy nhất cho các bản ghi để hỗ trợ khối lượng công việc khá nặng. Điều này có nghĩa là phần cứng để làm điều đó khá rẻ, do đó có một chi phí nhỏ cho một chiến thắng hiệu suất và độ tin cậy lớn.

  • Nếu mảng dữ liệu của bạn đi xuống, các bản ghi sẽ không bị mất. Nếu bạn có một chiến lược sao lưu phù hợp, bạn có thể khôi phục từ bản sao lưu và cuộn từ các bản ghi. Điều này có nghĩa là toàn bộ một mảng có thể đi xuống trên máy chủ mà không phải là một điểm thất bại duy nhất. Cả mảng nhật ký và dữ liệu phải thất bại đồng thời gây mất dữ liệu.


Cảm ơn câu trả lời đặc biệt là giải thích lý do tại sao hệ thống đang chạy chậm.
Philip Fourie

Tại chỗ trên. Tôi thậm chí sẽ đề nghị tắt nó cho đến khi bạn có được ổ đĩa thay thế đó. Giống như Nigel nói, bạn không có chiến lược phục hồi. Mất một ổ đĩa khác, mất tất cả.
Stu Thompson

Xin chào Nigel, cảm ơn vì đã dành thời gian và chia sẻ chuyên môn của bạn. Đó thực sự là lời khuyên tuyệt vời. Tôi sẽ báo cáo lại sau về kết quả của sự phục hồi.
Philip Fourie

5

1) Sao lưu.

Ngay bây giờ không có dữ liệu đã bị mất. Nếu sao lưu của bạn không cập nhật sao lưu ngay bây giờ.

2) Đọc hướng dẫn, gọi cho nhà cung cấp, vv

Các hệ thống RAID khác nhau có các bước khác nhau để thay thế một đĩa và thực hiện sai bạn có nguy cơ phá hủy toàn bộ mảng. Không cần biết bạn có loại phần cứng / phần mềm RAID nào, chúng tôi chỉ có thể đoán ở các bước cần thiết.

Ngoài ra, hiệu năng chậm là do RAID 5 ở trạng thái xuống cấp (nghĩa là: một đĩa chết) có hiệu suất đọc khủng khiếp. Kinh khủng như thế nào tùy thuộc vào cách lưu trữ chẵn lẻ và đĩa nào đã chết, nhưng tin "tốt" là hiệu suất chậm với một đĩa đã biến mất là một vấn đề được biết đến và không gây ra sự hoảng loạn.


4

Đầu tiên tôi sẽ đọc hướng dẫn cho phần cứng / phần mềm bạn đang sử dụng - phần phục hồi thất bại :)

Nên là một vấn đề đơn giản của việc thay thế đĩa và xây dựng lại mảng mặc dù.

Điểm quan trọng nhất trong những trường hợp như vậy là đĩa nên được thay thế càng sớm càng tốt vì nếu một đĩa khác bị hỏng có thể bạn sẽ mất dữ liệu. Ngoài ra, bạn nên giải quyết nguyên nhân thất bại - có phải vì đĩa đã cũ? Bạn có nên thay thế những người khác quá? Hay là do sức mạnh tăng, nhiệt hoặc rung?


1
có lẽ mất dữ liệu? Chắc chắn nhất là mất tất cả dữ liệu trên mảng! Đi tù, đừng vượt qua Go. (tất nhiên là sao lưu sang một bên.)
Stu Thompson

1

Theo như tôi hiểu về RAID5, khi bạn thay thế ổ đĩa bị lỗi, nó sẽ tự động được xây dựng lại, từ thông tin được lưu trữ trên hai cái kia. Việc bạn có thể 'trao đổi nóng' ổ đĩa mới vào vị trí hay không tùy thuộc vào hệ thống của bạn - trước tiên bạn có thể phải tắt nguồn. Dù bằng cách nào, xem xét chi phí ổ đĩa tương đối thấp và tầm quan trọng của dữ liệu của bạn (Phản ánh bởi quyết định sử dụng RAID5 của bạn ngay từ đầu), bạn thực sự nên có một ổ đĩa dự phòng, ngồi trong ngăn kéo, sẵn sàng cho tình huống như vậy .

Gần đây tôi đã tự mình xây dựng một PC phát triển mới và thiết lập các ổ dữ liệu chính trong RAID5. Tôi đã đặt hàng thêm một ổ đĩa cần thiết, để tôi sẵn sàng dự phòng cho thời điểm khẩn cấp đó (Điều đó tôi hy vọng sẽ không xảy ra)

Bây giờ bạn đã hỏi câu hỏi, tôi cho rằng tôi nên đọc thêm về chủ đề này.


Đối với khối lượng dữ liệu nhỏ, một cặp được nhân đôi sẽ tốt hơn vì nó thường có tốc độ truy cập tuần tự tốt hơn so với RAID-5 nhỏ. Nếu bạn muốn trao đổi nóng, hãy xem một số hệ thống vịnh trao đổi nóng trên một nơi nào đó như scsi4me.com
ConcernedOfTunbridgeWells

0

Hoàn toàn phụ thuộc hệ thống. Hướng dẫn sử dụng nói gì? Phần cứng của bạn có hỗ trợ hoàn toàn việc cắm các ổ đĩa mới từ bộ điều khiển vào khoang ổ đĩa không? Bạn có bản sao lưu gần đây?


0

Bài viết của NXC tổng hợp độc đáo. Chỉ trong trường hợp bạn không thay thế ổ đĩa bị lỗi trước khi lỗi thứ hai, vẫn có cơ hội tốt để có hầu hết mọi thứ (đôi khi là tất cả mọi thứ) được phục hồi bằng dịch vụ khôi phục chuyên dụng. Dữ liệu vẫn còn trên các đĩa và đĩa bị lỗi thường có thể được đưa trở lại cuộc sống trong phòng thí nghiệm chuyên ngành với thiết bị phù hợp. Tuy nhiên giá cho dịch vụ này khá cao. Có một đĩa dự phòng và sao lưu thích hợp (theo đề xuất của NXC) chắc chắn là cách để đi trong tương lai.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.