Tôi có nên 'chạy trong' một đĩa của cặp RAID 1 mới để giảm khả năng xảy ra lỗi thời gian tương tự không?


19

Tôi đang thiết lập một mảng RAID1 gồm hai ổ cứng 4TB mới.

Tôi đã nghe thấy ở đâu đó trước đây, rằng việc tạo ra một mảng RAID1 của các ổ cứng giống hệt mới được mua cùng một lúc, làm tăng khả năng chúng sẽ thất bại tại một thời điểm tương tự.

Do đó, tôi đang cân nhắc sử dụng một trong các ổ đĩa cứng trong một khoảng thời gian (có thể là một vài tuần) để cố gắng giảm khả năng cả hai bị hỏng trong một khoảng thời gian ngắn. (ổ đĩa không sử dụng sẽ bị ngắt kết nối trong ngăn kéo)

Điều này có vẻ như là một cách tiếp cận hợp lý, hoặc tôi có nhiều khả năng chỉ lãng phí thời gian của tôi?


2
Đó là một yêu cầu thường được nghe, nhưng tôi chưa thấy bất kỳ tài liệu nào hỗ trợ nó. Một rủi ro thực sự hơn nhiều là, một trong những đĩa của bạn có thể phát triển một số thành phần xấu, không được chú ý trong một thời gian. Nhưng một khi đĩa khác bị lỗi, bạn sẽ nhận thấy những thành phần xấu đó trong quá trình xây dựng lại.
kasperd 17/03/2015

8
Nếu bạn đang làm việc với hàng tá ổ đĩa, có thể đáng để xem xét tìm nguồn cung ứng từ một vài đợt. Đối với một bộ hai ổ đĩa, không đáng để làm điều này. Tỷ lệ thất bại không phải là tương tự hoặc có thể dự đoán được ... một cái có thể kéo dài 3 tháng, cái kia có thể kéo dài 5 năm.
jlehtinen 17/03/2015

Cá nhân tôi sẽ không đột kích chỉ với hai ổ đĩa. Sử dụng nhiều ổ đĩa cho dung lượng tốt hơn. Ví dụ: 3 ổ đĩa sẽ mang lại 8 TB tổng dung lượng lưu trữ, không giống như 2 ổ đĩa, chỉ cho 4 TB. Bất kỳ một ổ đĩa nào cũng có thể thất bại trong bộ ba và nếu chúng đến từ ba nguồn, tỷ lệ thất bại cùng một lúc là thấp.
phyrfox 17/03/2015

3
@phyrfox - RAID-5 (và -6) có các đặc tính hiệu năng khác với RAID-1 có thể không tương thích với ứng dụng của anh ấy. Với các ổ đĩa lớn (đặc biệt là các ổ đĩa chất lượng tiêu dùng), nếu tôi sẽ sử dụng các cấp RAID cao hơn, tôi chắc chắn sẽ sử dụng RAID-6 để bảo vệ chống lại lỗi đĩa thứ hai trong khi xây dựng lại mảng sau một lỗi đĩa đơn. Tôi đã chạy một mảng 5 đĩa RAID-6 trong 2 năm bằng cách sử dụng một bộ ổ đĩa được mua cùng một lúc - một đĩa không thành công trong một tháng, tất cả các phần còn lại không cho thấy bất kỳ vấn đề nào.
Johnny

1
@phyrfox RAID5 sẽ giảm chi phí cho mỗi megabyte nhưng thực sự sẽ TĂNG cơ hội gặp sự cố vì có nhiều ổ đĩa bị lỗi hơn.
Caltor 17/03/2015

Câu trả lời:


16

Đúng là phí thời gian.

Bạn sẽ không thể gây ra thất bại hoặc làm căng các ổ đĩa một cách có ý nghĩa. Bạn có RAID và đó là một khởi đầu tốt. Chỉ cần đảm bảo rằng bạn đã giám sát tại chỗ để thực sự phát hiện ra các lỗi khi chúng xảy ra và sao lưu để bảo vệ chống lại thảm họa.


2
Đồng ý cho HDS thông thường, nhưng đối với ssds thì đó là một câu chuyện rất khác. Nghĩ rằng điều này đáng chú ý bây giờ trước khi các ssds 4tb trở nên rẻ và có sẵn và độc giả không nhận ra chúng ta đang nói về việc quay cuồng ở đây, nhưng có lẽ sau đó họ sẽ xử lý nhiều bài viết hơn.
symcbean 17/03/2015

3
Có - chắc chắn bất kỳ ổ đĩa 'doanh nghiệp' nào cũng đã được thử nghiệm để vượt qua những thất bại đầu đời trên đường cong bồn tắm. Mặc dù tôi biết nếu bạn mua một cặp máy phát điện, lời khuyên là thay thế 66% đến 33%, bởi vì cách đó cả hai đều không bị hao mòn đồng thời. Tuy nhiên, với các ổ đĩa, MTBF có độ lệch chuẩn khá lớn, do đó, nó ít đáng quan tâm hơn.
Sobrique 18/03/2015

5

Có thể tốt hơn để sử dụng các nhãn hiệu hoặc loạt đĩa khác nhau cùng nhau nếu bạn lo lắng về điều này.

Tôi đã thấy các đĩa có cùng loại và tuổi không thành công trong các cụm, vì vậy IMHO không phải là một sự phát triển đô thị.


1
Tôi cũng có, nhưng nó đã xuống phần mềm tinh ranh hơn là bất cứ thứ gì liên quan đến MTBF.
Sobrique 18/03/2015

2

Câu hỏi tuyệt vời - Tuy nhiên, không giống như đèn pha ô tô, đây là một sự lãng phí thời gian. Xếp hạng MTBF [thời gian trung bình giữa các lần thất bại] cho các ổ đĩa 4 GB [WD Red trong ví dụ này] là 1.000.000 giờ. Tỷ lệ hai ổ đĩa xấu đi trong gương cùng một lúc là cực kỳ hiếm. Khi tôi thấy điều này xảy ra, đó là do ổ đĩa đầu tiên bị lỗi mà không ai nhận ra. Hữu ích hơn để bảo vệ với các bản sao lưu hơn là làm phiền việc ghi vào một ổ đĩa trước. Nếu bạn kết hợp các loại ổ đĩa, hãy chắc chắn rằng các ổ đĩa có cùng tốc độ. Nếu bạn bị hoang tưởng, thì RAID 10 là dành cho bạn.


MTBF giả định rằng các đĩa là độc lập, mà chúng không nằm trong cùng một bộ RAID. Có những lý do khác đây là một sự lãng phí thời gian, nhưng một con số vô lý được phát hành bởi nhà sản xuất có mối tương quan yếu với thực tế không phải là một trong số đó.
HoplessN00b

5
Nếu một ổ cứng thực sự thời gian trung bình đã nêu giữa các lần hỏng hóc thì tại sao thời gian bảo hành lại ngắn như vậy? 1 triệu giờ là 114 năm, cho hoặc nhận. WD Red Pro (vì tôi đã chọn một trong số rất nhiều) có vẻ được bảo hành năm năm. Ngay cả khi bạn mất một nửa thời gian trung bình để thất bại, Western Digital vẫn không tin rằng nó sẽ đáng tin cậy hơn một phần mười của giai đoạn MTBF đã nêu. Bây giờ, mà bạn sẽ có xu hướng tin tưởng hơn; một số thống kê ngẫu nhiên không có nghĩa vụ, hoặc tiền thực sự ở đâu? (Trả lại bảo hành, hoàn lại tiền, tân trang và thay thế có giá bằng tiền thật.)
CVn 17/03/2015

1
@ MichaelKjorling: Nếu họ bảo hành MTBF, họ sẽ thay thế hơn 50% (vâng, phần đuôi dài trên bản phân phối) của các ổ đĩa được bảo hành. Chắc chắn bạn nên xem tiền ở đâu, nhưng tôi thấy không có lý do gì để tin rằng MTBF không phải là một đơn đặt hàng lớn hơn bảo hành, và một số người tin rằng đó là.
Ben Voigt

@ MichaelKjorling Tôi đã thấy phần cứng với một MTBF được xuất bản là 100 nghìn giờ sẽ luôn bị hao mòn sau 1k giờ hoạt động. Thế hệ tiếp theo của phần cứng có chỉ số MTBF được công bố là 200 nghìn giờ. Khi lô phần cứng mới đầu tiên hoạt động được 48 giờ, hơn 50% trong số đó đã thất bại.
kasperd

1

Mặc dù về mặt lý thuyết, dữ liệu không hỗ trợ nhu cầu work inổ đĩa của bạn.
Không chỉ một vài tuần sẽ không thực sự gây ảnh hưởng, tỷ lệ thất bại không thực sự hoạt động khi chỉ nhìn vào hai ổ đĩa.

Mặc dù đã có một số dấu hiệu cho thấy tỷ lệ thất bại được chuẩn hóa nhiều hơn khi nói đến các ổ đĩa của cùng một mô hình.

Hầu hết các kết quả liên quan đến tuổi tác đều bị ảnh hưởng bởi các lần lái xe ... Thật thú vị, điều này không thay đổi kết luận của chúng tôi. Trái ngược với kết quả liên quan đến tuổi, chúng tôi lưu ý rằng tất cả các kết quả được hiển thị trong phần còn lại của bài báo không bị ảnh hưởng đáng kể bởi hỗn hợp dân số. (nhấn mạnh của tôi)

Như vậy, những thất bại liên quan đến tuổi tác, vốn chỉ là một phần nhỏ của những thất bại, có thể phần nào tương quan với việc điều khiển các loại rượu. Nhưng phần lớn các thất bại không thể.
Nếu bạn thêm vào tỷ lệ thất bại chung này, có thể lên tới 8% trong một năm nhất định, tỷ lệ của cả hai ổ đĩa không thành công trong cùng một năm là nhỏ, chúng thất bại trong cùng một tuần là không đáng kể.
Và đây là nếu bạn nhìn vào mọi nguyên nhân thất bại có thể xảy ra, không chỉ những thất bại liên quan đến tuổi tác.

Nếu bạn muốn giảm thiểu rủi ro, nhưng hai ổ đĩa của một cổ điển khác nhau.
Nếu bạn muốn đảm bảo, hãy mua bảo hiểm.
Và như câu trả lời của ewwhite đã nêu, sao lưu và giám sát là bắt buộc.


0

Đây thường là một đối số cho SSD nhiều hơn so với ổ cứng theo kinh nghiệm của tôi. SSD có chu kỳ ghi hạn chế, do đó, nếu bạn sử dụng RAID1 với hai ổ SSD cùng loại, cả hai sẽ hết chu kỳ ghi gần như cùng một lúc.

Đối với các thất bại chung, trừ khi bạn có một vấn đề nghiêm trọng như rung động hàng loạt, tĩnh hoặc nhiệt độ cao; Tôi không nghi ngờ bạn sẽ thấy 2 trong số 2 ổ đĩa bị hỏng cùng một lúc.

Một mối quan tâm chính với RAID1 (và RAID10) với các ổ đĩa lớn hơn như 4TB là việc xây dựng lại. Với gương 2 ổ đĩa, khi một ổ đĩa bị hỏng, ổ đĩa kia sẽ mang tải trọng gấp đôi. Sau đó, khi bạn xây dựng lại, ổ đĩa đó thậm chí còn tải nhiều hơn. Nếu có bất cứ điều gì sai với ổ đĩa đó, nó có khả năng thất bại trong những điều kiện đó, đặc biệt là việc xem xét việc xây dựng lại một chiếc gương 4TB khi tải có thể mất nhiều thời gian.


0

Bạn có thể làm, nhưng nó sẽ không giúp quá nhiều.

Ví dụ, nếu có một kim trong nguồn đầu vào, cùng một kim sẽ giết cả hai đĩa.

Điều quan trọng là: bạn cần có một bản sao lưu tốt. Raid không bù đắp cho một bản sao lưu tốt. Trên thực tế, nếu bạn có một bản sao lưu tốt, có lẽ một cuộc đột kích phản chiếu chắc chắn không cần thiết (nếu bạn có thể chịu đựng được sự cố sập hệ thống một lần trong khoảng 2-3 năm).


3
RAID là về tính khả dụng, không phải về sao lưu dữ liệu. Vấn đề là giữ cho hệ thống luôn sẵn sàng nếu một ổ đĩa bị lỗi, không bảo vệ dữ liệu trên ổ đĩa.
HoplessN00b

@ HoplessN00b Đây chính xác là những gì tôi đã cố gắng giải thích trong câu trả lời, có lẽ tôi đã không đủ rõ ràng?
peterh nói rằng phục hồi Monica

Câu của bạn ở cuối có bùn nước.
Vô vọngN00b

@ HoplessN00b Raid cũng bảo vệ khỏi mất dữ liệu do lỗi đĩa. Điều này thường dẫn đến kết luận sai, rằng nó có thể được sử dụng như một bản sao lưu. Nhưng sử dụng đột kích, và sử dụng các bản sao lưu, đây là những thứ phụ thuộc vào tình huống. Có những trường hợp, ngay cả một môi trường sysadm chuyên nghiệp cũng không cần cả hai. Theo tôi, mục tiêu không phải là buộc cả hai vào một hệ thống thiếu kinh nghiệm, mà là để làm cho anh ta rõ ràng, rằng phản chiếu các đĩa và sao lưu dữ liệu của nó là các giải pháp khác nhau cho các vấn đề khác nhau.
peterh nói rằng phục hồi Monica
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.