Các bộ điều khiển RAID thường có vấn đề tương thích thương hiệu ổ đĩa SATA?


22

Chúng tôi đã vật lộn với bộ điều khiển RAID trong máy chủ cơ sở dữ liệu của chúng tôi, Lenovo ThinkServer RD120. Đây là một Adaptec được đổi thương hiệu mà Lenovo / IBM đặt tên là ServeRAID 8k .

Chúng tôi đã vá chiếc ServeRAID 8k này lên đến bản mới nhất và lớn nhất:

  • Phiên bản RAID bios
  • Phiên bản bios bảng nối đa năng
  • Trình điều khiển Windows Server 2008

Bộ điều khiển RAID này đã có nhiều bản cập nhật BIOS quan trọng ngay cả trong thời gian 4 tháng ngắn ngủi chúng tôi đã sở hữu nó và lịch sử thay đổi chỉ là .. tốt, đáng sợ.

Chúng tôi đã thử cả chiến lược ghi lại và ghi lại trên các ổ RAID hợp lý. Chúng tôi vẫn nhận được lỗi I / O không liên tục trong hoạt động đĩa nặng. Chúng không phổ biến, nhưng nghiêm trọng khi chúng xảy ra, vì chúng gây ra thời gian chờ I / O của SQL Server 2008 và đôi khi không thành công với các nhóm kết nối SQL.

Chúng tôi đã ở cuối sợi dây của chúng tôi khắc phục sự cố này. Thiếu những thứ khó tính như thay thế toàn bộ máy chủ hoặc thay thế phần cứng RAID, chúng tôi đang tuyệt vọng.

Khi tôi lần đầu tiên nhận được máy chủ, tôi đã gặp sự cố khi ổ đĩa số 6 không được nhận ra. Chuyển đổi ổ đĩa cứng sang một nhãn hiệu khác, lạ thay, đã sửa lỗi này - và cập nhật BIOS RAID (lần đầu tiên trong nhiều lần) đã sửa nó vĩnh viễn, vì vậy tôi có thể sử dụng ổ đĩa "không tương thích" ban đầu trong khoang 6. Trên một Linh cảm, tôi bắt đầu cho rằng các ổ đĩa cứng Western Digital SATA mà tôi chọn không tương thích với bộ điều khiển 8k ServeRAID.

Mua 6 ổ cứng mới là một trong những lựa chọn rẻ hơn trên bàn, vì vậy tôi đã mua 6 ổ cứng Hitachi (còn gọi là IBM, hay Lenovo) theo lý thuyết rằng bộ điều khiển RAID của IBM / Lenovo có khả năng hoạt động với các ổ đĩa thông thường bán với.

Có vẻ như linh cảm đó đã được đền đáp - chúng tôi đã trải qua ba ngày tải nặng nhất (mon, tue, wed) mà không gặp một lỗi I / O nào. Trước đó, chúng tôi thường xuyên có ít nhất một "sự kiện" I / O trong khung thời gian này. Có vẻ như việc chuyển đổi thương hiệu ổ cứng đã khắc phục các sự cố I / O RAID không liên tục của chúng tôi!

Mặc dù tôi hiểu rằng IBM / Lenovo có thể kiểm tra riêng bộ điều khiển RAID của họ với nhãn hiệu ổ đĩa cứng của riêng họ, tôi băn khoăn rằng bộ điều khiển RAID sẽ có các vấn đề I / O tinh tế như vậy với các nhãn hiệu ổ cứng cụ thể.

Vì vậy, câu hỏi của tôi là, loại ổ đĩa SATA không tương thích phổ biến với bộ điều khiển RAID? Có một số nhãn hiệu ổ đĩa hoạt động tốt hơn các ổ đĩa khác, hoặc được "xác nhận" đối với bộ điều khiển RAID cụ thể không? Tôi đã giả định rằng tất cả các ổ cứng SATA hàng hóa đều giống nhau và sẽ hoạt động tốt trong mọi bộ điều khiển RAID cụ thể (có chất lượng đủ).

Câu trả lời:


6

, tôi đã gặp phải điều này với thẻ cấp thấp và trình điều khiển lỗi. Tuy nhiên, không , không phải trên một thẻ thương hiệu thích hợp cập nhật. Wow là tất cả những gì tôi có thể nói. Một điều cần xem xét, có thể đó là một lỗi với ổ đĩa hơn là bộ điều khiển RAID.

Tôi không có câu trả lời hay, nhưng dường như bạn đã sử dụng hết hầu hết các tùy chọn của mình ngoài việc thay thế thẻ, (và thay thế các ổ đĩa đã lừa) đây là một vài ý tưởng bạn có thể xem xét để khắc phục sự cố:

  • Các ổ WD là ổ RE (RAID Edition), phải không? Việc khôi phục lỗi giới hạn thời gian là rất quan trọng, vì vậy nếu bạn không có điều đó và ổ đĩa đang cố khôi phục khu vực đó, bạn sẽ nhận được một khoảng dừng looooong từ ổ đĩa đó. Nếu bộ điều khiển RAID kiên nhẫn và không làm rơi ổ đĩa, bạn sẽ gặp vấn đề lớn trong tay.

  • Kiểm tra dữ liệu SMART trên các ổ đĩa bạn đã xóa và xem có gì thú vị không.

Một nhận xét khác về tầm quan trọng của tính năng phục hồi lỗi giới hạn thời gian (TLER), từ hỗ trợ của nhà cung cấp NAS / RAID:

Như tôi đã đề cập trước đây, chúng tôi luôn đề nghị khách hàng sử dụng ổ đĩa cấp doanh nghiệp nếu họ sử dụng ổ đĩa trong cài đặt RAID. Các ổ đĩa cấp doanh nghiệp có thời gian đáp ứng phù hợp hơn để RAID sẽ an toàn hơn.


dunno, nhưng họ đã có "Phục hồi lỗi giới hạn thời gian dành riêng cho RAID" như được hiển thị trên tab thông số kỹ thuật ở đây .. newegg.com/Sản phẩm / Productt.aspx? Item = N82E16822136143
Jeff Atwood

Vâng, bạn đã có những cái đúng. (Lưu ý RE2 được liệt kê trong tiêu đề.) Điều đó bắn ra lý thuyết đó! Tất nhiên, tôi vẫn sẽ kiểm tra dữ liệu SMART chỉ trong trường hợp (vâng, tôi biết nó hiếm khi hữu ích) ...
TorgoGuy

Rốt cuộc, các ổ đĩa là loại không ổn định. Brent Ozar thừa hưởng các ổ đĩa cũ của chúng tôi và phải RMA ít nhất một trong số chúng vì sự kỳ lạ ..
Jeff Atwood

Ngoài ra, một cuộc thảo luận thú vị liên quan đến tính năng TLER mà dường như một số nhà cung cấp xem là một phần mềm đặc biệt mà họ lật để làm cho các ổ đĩa "enterprisey" một cách kỳ diệu .. fatwallet.com/forums/recired-deals/993547
Jeff Atwood

13

Ngay cả đối với các ổ đĩa cứng không phải là RAID, máy tính để bàn cũ, việc mua các ổ đĩa từ nhà cung cấp (ở mức đánh dấu vô lý dự kiến) thường có thể tạo ra sự khác biệt. Ví dụ, Apple cẩn thận chỉ gửi các ổ đĩa thực sự có khả năng tôn vinh F_FULLSYNC fcntl()cờ của Mac OS X , điều này sẽ giúp đảm bảo những thứ như sao lưu Time Machine hoạt động đáng tin cậy.

Một lần nữa, đây là sử dụng máy tính để bàn vanilla đơn giản không có RAID liên quan. Bất cứ điều gì phức tạp hơn thế và bạn chắc chắn muốn mua, nếu không phải là ổ đĩa có giá quá cao của nhà cung cấp, thì ít nhất là các mô hình ổ đĩa mà bạn biết chắc chắn đều nằm trong danh sách "được phê duyệt" của nhà cung cấp.

Vì vậy, để trả lời câu hỏi của bạn, nó có phổ biến không? Tôi nói, vâng, phổ biến hơn bạn nghĩ, thậm chí vượt ra ngoài lĩnh vực doanh nghiệp.


Tôi chắc chắn sẽ nhận được các mô hình ổ đĩa mà nhà cung cấp thường bán nếu bạn định nâng cấp ổ đĩa DIY với chi phí thấp hơn. Tôi cũng khuyên bạn không nên mua ổ đĩa (hoặc bộ điều khiển) hệ thống chỉ mới bắt đầu giao hàng để cuối cùng bạn không phải là người tìm thấy lỗi! Vì lý do nào đó, SATA có vẻ không ổn định hơn so với SAS vì lý do này ...
Christopher Edwards

4

Tôi không nghĩ nó phổ biến. Tuy nhiên, ngay khi bạn bắt đầu sử dụng bộ điều khiển lưu trữ doanh nghiệp, cho dù đó là bộ điều khiển RAID độc lập hay SAN, bạn thường muốn tuân thủ danh sách tương thích của họ khá chặt chẽ.

Bạn có thể tiết kiệm một số tiền cho giá nhãn dán bằng cách mua một loạt đĩa giá rẻ, nhưng đó có lẽ là một trong những lĩnh vực cuối cùng tôi muốn tiết kiệm tiền - vì tầm quan trọng của dữ liệu trong hầu hết các tình huống.

Nói cách khác, sự không tương thích rõ ràng là rất không phổ biến, nhưng việc tuân thủ tương thích rõ ràng là điều nên làm.


4

Tôi không mơ ước sử dụng đĩa SATA cho máy chủ - không ai trong số họ có chu kỳ hoạt động dự kiến ​​của ổ đĩa chất lượng máy chủ và họ không có bộ lệnh phong phú mà SCSI / SAS có để theo dõi hiệu suất và sức khỏe của ổ đĩa. Các máy chủ của Lenovo rất rẻ và tuyệt vời nếu bạn có nhiều máy chủ mà không có máy chủ nào thực sự quan trọng nhưng có một lý do khiến các máy chủ 300 series của HP chiếm 40% thị trường - chúng hoạt động. Cụ thể, bộ điều khiển đĩa 'SmartArray của họ là vô song về độ tin cậy và hiệu suất và đảm bảo trước sự cố của họ là một bổ sung đáng hoan nghênh. Không phải rẻ nhất nhưng thời gian của bạn đáng giá bao nhiêu? Tôi đã mua máy chủ (cũng là máy tính đầu tiên của Compaq) trong hai mươi năm nay và không có vấn đề gì khi mua 500-800 máy chủ mới mỗi năm mà tôi làm. Nghiêm túc kiểm tra chúng ra.


2

Câu trả lời như mọi khi là "nó phụ thuộc".

Đối với bộ nhớ doanh nghiệp nhất định (giả sử EMC), nhà cung cấp sẽ đặc biệt đủ điều kiện ổ đĩa và thậm chí đi đến mức tải phần mềm tùy chỉnh.

Như Mark nói, tôi thấy nó là tốt nhất khi bạn theo dõi danh sách được chấp thuận của nhà cung cấp nếu có. Tiết kiệm chi phí ban đầu lớn hơn nhiều so với thời gian cố gắng săn lùng gremlins.


đúng, nhưng các ổ đĩa Hitachi SATA "đặc biệt" của Lenovo có giá 250 đô la và tôi có thể mua cùng một ổ đĩa Hitachi với giá 60 đô la. Đó là một sự khác biệt gần như 5x, nói cách khác .. $ 1250 so với $ 300. Tôi sẵn sàng thực hiện một số thử nghiệm cho một người lớn ..
Jeff Atwood

Tôi biết việc đánh dấu đôi khi thật lố bịch, bạn sẽ thấy giá cho các ổ EMC! Nhưng nó nắm rõ giá trị của dữ liệu của bạn. Có lưu trữ đáng tin cậy có giá $$$. Don MacAskill từ Smugmug đã phát cuồng về Mặt trời 7410 và đó có thể là điều bạn muốn kiểm tra.
Jauder Ho

Tôi tự hỏi nếu có một thẻ 3ware được hỗ trợ. Tôi đã có những trải nghiệm tốt với họ trong những năm qua.
Jauder Ho

2

Bạn có một bộ điều khiển SAS, đó có thể là vấn đề. Trong khi giao thức SAS có thể được sử dụng để tạo đường hầm lệnh ATA, tín hiệu ở mức vật lý hơi khác một chút (SAS sử dụng điện áp cao hơn và vi sai rộng hơn). Hầu như tất cả các bộ điều khiển đều có thể nói chuyện trực tiếp với các ổ đĩa SATA, nhưng nếu có một bảng nối đa năng (lớn? Crappy?) Ở giữa thì tín hiệu có thể bị gián đoạn. Thông thường trong thế giới doanh nghiệp, việc gắn trình điều khiển SATA trực tiếp vào bộ điều khiển SAS không được hỗ trợ chính thức, bạn nên sử dụng một bộ chuyển đổi (một bảng logic nhỏ kết nối trực tiếp với đĩa mà một bên hiểu được giao thức SAS đầy đủ, mặt khác nói ATA - theo cách này, bảng nối đa năng mang tín hiệu SAS cao hơn).

Một số điều liên quan: trộn các ổ đĩa SAS và SATA trên cùng một bảng nối đa năng có xu hướng thất bại, vì tín hiệu của tất cả các ổ đĩa (bao gồm cả SAS) được hạ xuống mức SATA.


1

Rất có thể các ổ WD của bạn cần cập nhật firmware . Xem ghi chú này của IBM để tải xuống và áp dụng bản cập nhật. Như bạn có thể thấy từ các hướng dẫn , các ổ WD khác xa với các ổ đĩa duy nhất có vấn đề.

Nếu bạn định đặt các ổ đĩa của mình vào môi trường máy chủ bị đánh thuế, bạn chắc chắn sẽ gặp nhiều vấn đề hơn so với cấu hình máy tính để bàn thông thường.

Bạn có thể bình luận về lý do tại sao bạn chọn sử dụng loạt ổ đĩa Deskstar thay vì loạt Ultrastar của lớp Enterprise / RAID không? Bạn có cảm thấy chi phí tăng thêm không xứng đáng với độ tin cậy và tốc độ tăng thêm?


khi nói đến ổ đĩa cứng, tôi tin vào rất nhiều trong số chúng - các mảng giá rẻ và dễ thay thế, trong đó hiệu suất đến từ quy mô.
Jeff Atwood

Cẩn thận khi sử dụng ổ đĩa máy tính để bàn với bộ điều khiển lưu trữ cấp doanh nghiệp. Ổ đĩa cấp doanh nghiệp (thường) hỗ trợ các lệnh và yêu cầu mà ổ đĩa cấp máy tính để bàn không. Một máy chủ doanh nghiệp mà tôi đã từng thừa kế đang sử dụng các ổ đĩa cấp máy tính để bàn và thấy các lỗi thường gặp khi bộ điều khiển cố lấy thông tin về nhiệt độ và sức khỏe của ổ đĩa từ các ổ đĩa. Vì bộ điều khiển doanh nghiệp cho rằng bạn sẽ sử dụng ổ đĩa doanh nghiệp, bộ điều khiển không thể xử lý một cách duyên dáng một ổ đĩa không đáp ứng với các yêu cầu này (vì đó không phải là thiết lập được hỗ trợ). Đó là tất cả YMMV
bta

0

Là một kỹ sư làm việc với các bộ điều khiển RAID, tôi có thể nói rằng không có gì lạ khi một số thương hiệu ổ đĩa có vấn đề với một số bộ điều khiển RAID nhất định. Mỗi ổ đĩa đều có các quirks riêng và bất kỳ mô hình ổ đĩa nào được liệt kê trong danh sách "thiết bị tương thích" của bộ điều khiển sẽ có các quirks được tính bởi bộ điều khiển. Để một mô hình ổ đĩa hiển thị trong danh sách, nó phải đáp ứng các tiêu chuẩn của nhà sản xuất bộ điều khiển về hiệu suất và độ tin cậy. Bất kỳ ổ đĩa nào không có trong danh sách này đều có thể hoạt động, nhưng vì nó chưa trải qua quá trình kiểm tra nghiêm ngặt như các thiết bị "được phê duyệt", YMMV.

Cụ thể, giao thức SATA cho phép các lệnh dành riêng cho nhà cung cấp (không được chuẩn hóa) có thể được xác định bởi ổ đĩa hoặc bộ điều khiển. Trong trường hợp của bạn, bạn có thể thấy một bộ điều khiển đang mong đợi một ổ đĩa đáp ứng với một lệnh độc quyền cụ thể hoặc một ổ đĩa đang mong đợi thấy một lệnh độc quyền không bao giờ đến.

Một khả năng khác là các ổ đĩa có vấn đề của bạn không hoạt động tốt trong một số khối lượng công việc căng thẳng nhất định và hành vi bạn thấy là đủ để Adaptec / IBM không liệt kê mô hình ổ đĩa đó như được hỗ trợ.

Thật không may, các giao thức lưu trữ (SATA, SAS, v.v.) không đẹp như các giao diện được tiêu chuẩn hóa khác (USB, PCI, v.v.) trong đó tất cả những gì bạn cần là một chiếc xe buýt và một thiết bị nói cùng ngôn ngữ và mọi thứ đều ổn. Đặc biệt, khi nói đến thiết bị cấp Doanh nghiệp, các nhà sản xuất thiết bị và nhà sản xuất ổ đĩa dành nhiều thời gian và năng lượng hợp tác để đảm bảo khách hàng có được hiệu suất tốt nhất có thể trong số các cấu hình được sử dụng bởi phần lớn khách hàng (nghĩa là sử dụng ổ đĩa ra khỏi Danh sách "thiết bị được hỗ trợ"). Một ổ đĩa không có trong danh sách đó có thể đã được thiết kế để hoạt động tối ưu với một nhãn hiệu bộ điều khiển khác và các lỗi bạn đang thấy là tác dụng phụ của việc tối ưu hóa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.