Bắt buộc không gian miễn phí trên một SAN?


8

Tôi không phải là chuyên gia của SAN, tôi viết thư ở đây để có được manh mối về các vấn đề liên tục và bực tức mà chúng tôi gặp phải mà nhà cung cấp của chúng tôi dường như không thể giải quyết.

chúng tôi sở hữu một ENHANCE ES3160P4 SAN với các đĩa 16 x 2 Tb đã được cung cấp cho hệ thống giám sát video của chúng tôi. SAN đã được nhà cung cấp định cấu hình để sử dụng 14 đĩa trong một mảng RAID 5 và 2 đĩa là phụ tùng toàn cầu. RAID thường được chia thành 2 đĩa ảo có kích thước bằng nhau trải rộng trên toàn bộ không gian RAID. Mỗi một kết quả là một cái gì đó hơn 12 Tb. Mỗi đĩa ảo tương ứng với một LUN duy nhất, được gắn vào một máy chủ video duy nhất lưu trữ dữ liệu video liên tục và cho phép người dùng truy xuất các bản ghi khi cần. Các LUN được định dạng bằng NTFS và được đính kèm với máy chủ video Windows Server 2012 thông qua iSCSI. Các máy quay video có xu hướng sử dụng đầy đủ không gian có sẵn mà họ có.

Với cấu hình này, các đĩa của SAN bị lỗi và hỏng, và mỗi lần SAN không thể khôi phục RAID vì trong khi đó, một đĩa khác bị lỗi. Chúng tôi đã mất RAID như 4 lần trong vài tháng qua.

Vấn đề này dường như không phải do mẫu SAN xấu gây ra, bởi vì chúng tôi sở hữu ba máy khác cùng loại được cấu hình tương tự có vẻ có cùng các vấn đề. Chỉ có một không có vấn đề, nhưng tại thời điểm này nó không được sử dụng.

Sau một vài tháng kiểm tra và kiểm tra chưa biết, nhà cung cấp cuối cùng đã nói rằng SAN không nên sử dụng 100% nếu không nó sẽ xuống cấp nhanh, cũng như về mặt vật lý và nói rằng để giải quyết vấn đề, các đĩa ảo nên được tạo ra để lại 10-15% tổng dung lượng có sẵn trong RAID.

Tôi đã tìm kiếm trên web cho vấn đề này và không tìm thấy tuyên bố cụ thể nào nói điều này. Đối với tôi, có vẻ hợp lý hơn khi tạo các đĩa ảo bao trùm toàn bộ RAID và sau đó sử dụng LUN (nghĩa là cho phép Windows có không gian trống và tránh bị phân mảnh). Nếu không, tôi không hiểu tại sao ENHANCE SAN cho phép tạo các đĩa ảo bao trùm toàn bộ RAID nếu nó "nổi tiếng" đến mức phải còn một số không gian trống và tại sao nhà cung cấp lại cấu hình hệ thống như thế này ngay từ đầu ... nhưng đó là một điểm khác.

Cuối cùng, chúng tôi muốn giải quyết tình huống này. Bất kỳ đề nghị được chấp nhận. Như đã nói, tôi không phải là chuyên gia SAN, nhưng sau rất nhiều vấn đề tôi muốn thực sự hiểu liệu nhà cung cấp có biết chuyện gì đang xảy ra hay không, bởi vì chúng tôi không thể chấp nhận tình huống này nữa.

Rất cám ơn trước! Trân trọng

Chỉnh sửa: loại đĩa Như từ câu trả lời có vẻ là thông tin có liên quan, tôi thêm rằng các đĩa đều là mô hình Western Digital WD2001FYYG-01SL3.


3
Bất kỳ hệ thống được thiết kế phù hợp, nếu nó cần không gian dự trữ để hoạt động đúng, sẽ dự trữ không gian mà không cung cấp cho khách hàng sử dụng. Ảnh chụp nhanh có thể cần không gian và hệ thống tập tin Copy-on-Write làm, nhưng những hệ thống này thường có một khoản dự trữ nhỏ cho các mục đích đó. Ít nhất theo mặc định, tất nhiên có thể bị người dùng ghi đè nếu họ sẵn sàng chấp nhận rủi ro.
ptman

Ít nhất là các đĩa trông vẫn ổn, chúng là các đĩa SAS 24/7, nhưng chúng không nên thất bại thường xuyên ...
Sven

4
Iossue không phải là không gian trống, nó là một cấu hình ngu ngốc. 14 đĩa trong Raid 5 không ổn định theo toán học, đơn giản như vậy. Ngay cả Raid 6 cũng có thể đánh thuế nó. Nói chung - một Raid với đĩa 2tb về mặt thống kê không ổn định. Giai đoạn = Stage.
TomTom

1
@TomTom: Nếu bạn nghĩ đó là toán học đơn giản, vui lòng trả lời câu hỏi hiển thị toán học. Toán học khăn ăn của tôi nói rằng mảng ổn định nếu đọc 13 * 2TB để xây dựng lại một mảng bị suy giảm không có khả năng thất bại. Raid 6 tất nhiên là tốt hơn, đó là ổn định nếu việc xây dựng lại không có khả năng gặp lỗi kép.
MSalters

4
With this configuration the disks of the SAN are failing and failing, and each time the SAN cannot recover the RAID because another disk fails in the meanwhile. We lost the RAID like 4 times in the last few months.Điều này chính xác bởi vì, như TomTom nói, các đĩa quá lớn đối với RAID5. Và có lẽ RAID 6 cũng vậy, FWIW. Tỷ lệ xây dựng lại thành công của bạn không ở đâu gần 100% và bạn biết điều này bởi vì chính bạn, đã tuyên bố rằng bạn đã "xây dựng lại 4" không thành công trong vài tháng. Cấu hình RAID của bạn là ngu ngốc và nhà cung cấp của bạn không đủ năng lực, đơn giản như vậy.
HoplessN00b

Câu trả lời:


10

Từ những gì bạn mô tả, vấn đề chính là họ đã quyết định sử dụng RAID5 cho một mảng lớn như vậy, đây là một lựa chọn khá tồi cho thiết lập này, vì chính xác lý do bạn gặp phải: Lỗi đĩa thứ 2 trong quá trình khôi phục phá vỡ mọi thứ, và thất bại thứ hai này là rất có thể có nguy cơ đó.

Nếu họ đã sử dụng ví dụ RAID6 thay vào đó, việc bị hỏng đĩa thứ 2 trong quá trình khôi phục sẽ không dẫn đến một mảng bị lỗi và quá trình khôi phục có thể tiến hành bình thường, với chi phí của một ổ đĩa có dung lượng lưu trữ ròng và ảnh hưởng hiệu năng nhất định.

Tôi không thể thấy việc để lại 15% dung lượng trống sẽ giúp ích gì cho vấn đề này và trong khi điều này có thể hoặc không phải là ý tưởng hay từ quan điểm hiệu năng cho hệ thống tệp, thì điều này rõ ràng không liên quan đến RAID bị lỗi. Tôi gọi nhảm nhí về điều đó.

Tất cả những gì đã nói, tôi không thể tự hỏi: Việc này xảy ra nhiều lần trong vài tháng dường như là quá nhiều ngay cả đối với hệ thống RAID5. Tôi sẽ đề nghị xem xét các loại đĩa được sử dụng - có thể nhà cung cấp của bạn đã sử dụng ổ đĩa máy tính để bàn giá rẻ thay vì ổ đĩa 24/7 được chứng nhận sẽ được sử dụng trong một hệ thống như vậy.


Cảm ơn cho đầu vào của bạn. Tôi chỉnh sửa câu hỏi thêm loại đĩa.
z2k

2

Tôi hoàn toàn hiểu đây là một bài viết cũ, nhưng khi tôi tiếp tục thấy các mảng RAID5 lớn trong sản xuất, tôi muốn thêm suy nghĩ của mình vào đây.

  • đĩa bị hỏng quá thường là trường hợp quá nóng và / hoặc quá nhiều rung động, có thể được tìm thấy trên các hệ thống được thiết kế kém hoặc vị trí xấu

  • mảng RAID5 lớn như vậy nên tránh mạnh mẽ . Theo nguyên tắc chung, là nhiều hơn để có một mảng RAID6 chứ không phải là một RAID5 + hotspare một. Trong trường hợp OP, thay vì có đĩa chẵn lẻ 1x với các điểm nóng toàn cầu gấp 2 lần, tốt hơn là có đĩa chẵn lẻ 2x trong cấu hình RAID6;

  • đó là chìa khóa để có một hệ thống đáng tin cậy để báo cáo lỗi và trạng thái: một mảng vô tình xuống cấp, không được giám sát là một công thức cho thảm họa.


tiếp tục thấy các mảng RAID5 lớn trong sản xuất "Lớn hơn phải tốt hơn!", phải không? Tôi cũng nói thêm rằng các mảng lớn như vậy có hiệu năng HORRIBLE nói chung do hình học và sự tranh chấp kém giữa nhiều LUN được chia sẻ từ cùng một mảng, ngay cả khi các mảng được xây dựng với RAID6. IME chỉ về các mảng lớn nhất mà tôi khuyên dùng là 4 + 1 RAID5 và 8 + 2 RAID6. Một số bộ điều khiển cao cấp có thể ẩn một số vấn đề về hiệu năng với các mảng lớn hơn, nhưng bộ điều khiển tốt nhất sẽ không giúp xây dựng lại thời gian.
Andrew Henle
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.