Tôi muốn so sánh độ tin cậy của các hệ thống RAID khác nhau với các ổ đĩa tiêu dùng (URE / bit = 1e-14) hoặc doanh nghiệp (URE / bit = 1e-15). Công thức để có xác suất thành công của việc xây dựng lại (bỏ qua các vấn đề cơ học, mà tôi sẽ tính đến sau) rất đơn giản:
error_probability = 1 - (1-per_bit_error_rate) ^ bit_read
Điều quan trọng cần nhớ là đây là xác suất để có được một URE, không nhất thiết chỉ có một.
Giả sử chúng ta muốn có 6 TB không gian có thể sử dụng. Chúng ta có thể lấy nó với:
RAID1 với mỗi đĩa 1 + 1 6 TB. Trong quá trình xây dựng lại, chúng tôi đọc lại 1 đĩa 6TB và rủi ro là: 1- (1-1e-14) ^ (6e12 * 8) = 38% cho người tiêu dùng hoặc 4,7% cho ổ đĩa doanh nghiệp.
RAID10 với 2 + 2 đĩa 3 TB mỗi đĩa. Trong quá trình xây dựng lại, chúng tôi chỉ đọc lại 1 đĩa 3TB (ổ được ghép với ổ không thành công!) Và rủi ro thấp hơn: 1- (1-1e-14) ^ (3e12 * 8) = 21% cho người tiêu dùng hoặc 2,4% cho ổ đĩa doanh nghiệp.
RAID5 / RAID Z1 với mỗi đĩa 2 + 1 dung lượng 3TB. Trong quá trình xây dựng lại, chúng tôi đọc lại 2 đĩa 3TB mỗi ổ và rủi ro là: 1- (1-1e-14) ^ (2 * 3e12 * 8) = 38% cho người dùng hoặc 4,7% hoặc ổ đĩa doanh nghiệp.
RAID5 / RAID Z1 với mỗi đĩa 3 + 1 2 TB (thường được sử dụng bởi người dùng các sản phẩm SOHO như Synologys). Trong quá trình xây dựng lại, chúng tôi đọc lại 3 đĩa 2TB mỗi ổ và rủi ro là: 1- (1-1e-14) ^ (3 * 2e12 * 8) = 38% cho người dùng hoặc 4,7% hoặc ổ đĩa doanh nghiệp.
Tính toán sai số cho dung sai đĩa đơn là dễ dàng, khó hơn là tính xác suất với các hệ thống chịu được nhiều lỗi đĩa (RAID6 / Z2, RAIDZ3).
Nếu chỉ có đĩa thứ nhất được sử dụng để xây dựng lại và đĩa thứ hai được đọc lại từ đầu trong trường hợp hoặc URE, thì xác suất lỗi là ổ được tính trên căn bậc hai (14,5% cho người tiêu dùng RAID5 2 + 1, 4,5% cho người tiêu dùng RAID1 1 + 2). Tuy nhiên, tôi cho rằng (ít nhất là trong ZFS có tổng kiểm tra đầy đủ!) Rằng ngang bằng thứ hai / đĩa khả dụng chỉ được đọc khi cần, có nghĩa là chỉ cần vài cung: có bao nhiêu URE có thể xảy ra trong đĩa thứ nhất? không nhiều, nếu không thì xác suất lỗi cho các hệ thống dung sai đĩa đơn sẽ tăng vọt thậm chí nhiều hơn tôi đã tính.
Nếu tôi đúng, một đĩa chẵn lẻ thứ hai thực tế sẽ giảm rủi ro xuống các giá trị cực kỳ thấp.
Đặt câu hỏi sang một bên, điều quan trọng cần lưu ý là các nhà sản xuất tăng xác suất URE cho các ổ đĩa dành cho người tiêu dùng vì lý do tiếp thị (bán thêm ổ đĩa cấp doanh nghiệp), do đó, ngay cả các ổ cứng loại tiêu dùng cũng sẽ đạt được đọc 1E-15 URE / bit .
Một số dữ liệu: http://www.high-rely.com/hr_66/blog/why-ston-5-stops- Work-in-2009-not /
Do đó, các giá trị tôi cung cấp trong ngoặc đơn (ổ đĩa doanh nghiệp) cũng áp dụng thực tế cho ổ đĩa tiêu dùng. Và các ổ đĩa doanh nghiệp thực sự có độ tin cậy cao hơn nữa (URE / bit = 1e-16).
Liên quan đến xác suất thất bại cơ học, chúng tỷ lệ thuận với số lượng đĩa và tỷ lệ thuận với thời gian cần thiết để xây dựng lại.