SAN với một vài ổ SSD, hay rất nhiều ổ cứng cũ?


9

Công ty của tôi đang cố gắng tìm ra loại SAN để mua. Điều này đặc biệt dành cho các máy chủ cơ sở dữ liệu đang bị ràng buộc IO (lưu trữ là DAS ngay bây giờ, nhưng chúng tôi đang đạt giới hạn của một máy chủ duy nhất và chúng tôi cũng muốn thêm phân cụm).

Chúng tôi cần một giải pháp sẽ tạo ra khoảng 3000 IOPS lâu dài (hiện tại chúng tôi đạt đỉnh khoảng 1000 IOPS). Hầu hết các hoạt động cơ sở dữ liệu của chúng tôi là đọc / ghi nhỏ. Dựa trên các cuộc thảo luận với các kỹ sư của HP và những người khác trực tuyến, một chiếc HP P2000 có cấu hình 24 SAS HD trong cấu hình RAID 10 sẽ cung cấp tốc độ chỉ trong khoảng ~ 20K. Thêm bộ điều khiển và các mục khác để xây dựng SAN đặt chúng tôi ngay khoảng ngân sách tối đa $ 30K.

Nhưng trực tuyến, tôi thấy rằng nhiều ổ SSD của SAS cung cấp tốc độ 80.000 IOPS +. Đây có phải là thực tế để mong đợi? Nếu vậy, có thực tế không khi lấy P2000 hoặc mức SAN tương tự và ném một vài ổ SSD vào đó? Cơ sở dữ liệu của chúng tôi là nhỏ, chỉ có một vài TB. Nếu chúng tôi làm điều này, chúng tôi sẽ còn dư tiền để mua SAN thứ hai để phản chiếu / chuyển đổi dự phòng, điều này có vẻ thận trọng.


3
Tôi sẽ trả lời điều này ngay.
ewwhite

Bạn có thể liên kết với mô hình / loại SAN cụ thể mà bạn quan tâm sử dụng không? Có nhiều cảnh báo đi kèm với mảng lưu trữ kiểu HP P2000. Làm thế nào để bạn có kế hoạch kết nối? iSCSI? Chất xơ? HỎI?
ewwhite

Ngoài ra, nền tảng cơ sở dữ liệu này là gì?
ewwhite

Đây là mô hình mà tôi đang xem, chỉ với một cấu hình ổ đĩa khác: aventissystems.com/product-p/200385.htm . DBMS là SQL Server Standard 2008 R2. Chúng tôi thực sự cởi mở với bất kỳ cấu hình / nhà cung cấp nào miễn là chúng tôi có thể "rẻ" quy mô trong tương lai và miễn là chúng tôi giữ trong ngân sách khiêm tốn của mình.
bíp bíp

Bạn cần bao nhiêu công suất?
ewwhite

Câu trả lời:


4

Tôi có thể nói về chi tiết cụ thể của những gì bạn đang cố gắng thực hiện. Thành thật mà nói, tôi sẽ không xem xét HP P2000 / MSA2000 cấp nhập cảnh cho mục đích của bạn.

Các thiết bị này có nhiều hạn chế và từ góc độ thiết lập tính năng SAN, không gì khác hơn là một hộp đĩa. Không phân tầng, không lưu đệm thông minh, tối đa 16 đĩa trong nhóm Đĩa ảo , khả năng IOPS thấp, hỗ trợ SSD kém, (đặc biệt là trên thiết bị bạn đã chọn).

Bạn sẽ cần phải tăng cường lên HP MSA2040 để xem bất kỳ lợi ích hiệu suất hoặc hỗ trợ chính thức nào với SSD. Thêm vào đó, bạn có thực sự muốn sử dụng iSCSI không?

DAS có thể là lựa chọn tốt nhất của bạn nếu bạn có thể chịu đựng được bộ nhớ cục bộ. Bộ lưu trữ flash PCIe sẽ có trong ngân sách của bạn, nhưng dung lượng sẽ cần được lên kế hoạch cẩn thận.

Bạn có thể giải thích các thông số kỹ thuật của máy chủ thực tế của bạn? Tạo / mô hình, vv

Nếu phân cụm là phải có, một tùy chọn khác là thực hiện đơn vị HP MSA2040, nhưng sử dụng đơn vị SAS thay vì iSCSI. Điều này ít tốn kém hơn so với các mô hình khác, cho phép bạn kết nối 4-8 máy chủ, cung cấp độ trễ thấp và thông lượng lớn và vẫn có thể hỗ trợ SSD. Ngay cả với các mô hình Fiber hoặc iSCSI, đơn vị này sẽ cung cấp cho bạn sự linh hoạt hơn so với mô hình bạn đã liên kết.


cảm ơn! Chúng tôi có tất cả các máy chủ HP, chủ yếu là HP DL380. Lý do duy nhất chúng tôi đã xem xét iSCSI là việc mở rộng 4 máy chủ qua có vẻ dễ dàng hơn (nếu chúng tôi muốn đẩy dữ liệu máy chủ khác lên SAN) và nó nhanh hơn một chút (10Gb so với 6Gb).
bíp bíp

Điều đó nói rằng, tôi sẽ xem MSA2040 ... không biết tại sao nó không bật lên trên radar của chúng tôi trước đây.
bíp bíp

Tôi có thể thấy sự nhầm lẫn ... Nếu bạn không có kế hoạch mở rộng ra ngoài 4 hoặc 8 máy chủ, thì SAS hoạt động khá tốt. Và nó không phải là 10Gb so với 6Gb ... đó là 10Gb so với giao diện 4 làn 12Gbps SAS (48Gbps đến bao vây).
ewwhite

Tôi chỉ thấy rằng phần mềm Remote Snap chỉ hoạt động trên iSCSI hoặc FC ... chúng tôi đã hy vọng sử dụng snap từ xa để phản chiếu SAN để khắc phục thảm họa. Hoặc có một quy trình khác thông qua SAS sẽ cho phép khả năng tương tự?
bíp bíp

@Beepbeep Tôi có thể sử dụng một quy trình DR khác. Tôi có xu hướng không dựa vào thiết bị lưu trữ hoặc nhân rộng cấp SAN. Nhưng phiên bản 10GbE và FC của MSA2040 có thể phù hợp hơn với bạn.
ewwhite

6

Nguyên tắc tôi sử dụng cho đĩa IO là:

  • 75 IOP trên mỗi trục chính cho SATA.

  • 150 IOP trên mỗi trục chính cho FC / SAS

  • 1500 IOP trên mỗi trục chính cho SSD.

Cũng như IOP trên mỗi mảng cũng xem xét IOP trên mỗi terabyte. Không có gì lạ khi kết thúc với tỷ lệ IOP trên mỗi TB rất tệ nếu thực hiện SATA + RAID6. Điều này có vẻ không quá nhiều, nhưng bạn sẽ thường kết thúc với việc ai đó phát hiện ra 'không gian trống' trên một mảng và muốn sử dụng nó. Mọi người thường mua hợp đồng biểu diễn và bỏ qua iops, khi thực sự điều ngược lại là đúng trong hầu hết các hệ thống doanh nghiệp.

Sau đó thêm chi phí phạt ghi cho RAID:

  • 2 cho RAID1, RAID1 + 0
  • 4 cho RAID5 (hoặc 4)
  • 6 cho RAID6.

Viết hình phạt có thể được giảm nhẹ một phần bộ đệm lớn viết tốt và trong trường hợp đúng. Nếu bạn có nhiều IO viết tuần tự (như nhật ký DB), bạn có thể giảm đáng kể các hình phạt ghi trên RAID 5 và 6. Nếu bạn có thể viết một dải đầy đủ (ví dụ: một khối trên mỗi trục chính), bạn không cần phải đọc để tính chẵn lẻ.

Giả sử bộ 8 + 2 RAID 6. Trong hoạt động bình thường cho một lần ghi IO, bạn cần phải:

  • Đọc khối 'cập nhật'.
  • Đọc khối chẵn lẻ đầu tiên
  • Đọc khối chẵn lẻ thứ hai
  • Tính toán lại tính chẵn lẻ.
  • viết tất cả 3. (6 IO).

Với một ghi đầy đủ được lưu trong bộ nhớ cache - ví dụ: 8 khối 'liên tiếp' kích thước của dải RAID, bạn có thể tính được tính chẵn lẻ trên toàn bộ lô mà không cần phải đọc. Vì vậy, bạn chỉ cần 10 lần ghi - một cho mỗi dữ liệu và hai lần tương đương.

Điều này làm cho hình phạt viết của bạn 1.2.

Bạn cũng cần lưu ý rằng viết IO rất dễ lưu trữ - bạn không cần phải đưa nó vào đĩa ngay lập tức. Nó hoạt động trong một ràng buộc thời gian mềm - miễn là trung bình ghi của bạn không vượt quá tốc độ trục chính, tất cả sẽ có thể chạy ở 'tốc độ bộ đệm'.

Mặt khác, đọc IO, bị hạn chế về thời gian - bạn không thể hoàn thành việc đọc cho đến khi dữ liệu được tìm nạp. Các thuật toán đọc bộ đệm và bộ đệm đọc trở nên quan trọng tại thời điểm đó - các mẫu đọc có thể dự đoán được (ví dụ như tuần tự, khi bạn nhận được từ bản sao lưu) có thể được dự đoán và tìm nạp trước, nhưng các mẫu đọc ngẫu nhiên thì không thể.

Đối với cơ sở dữ liệu, tôi thường đề nghị bạn giả sử rằng:

  • hầu hết IO 'cơ sở dữ liệu của bạn là đọc ngẫu nhiên. (ví dụ xấu cho truy cập ngẫu nhiên). Nếu bạn có thể đủ khả năng chi trả, RAID1 + 0 là tốt - bởi vì các đĩa được nhân đôi cung cấp hai nguồn đọc.

  • hầu hết IO 'log' của bạn là ghi tuần tự. (ví dụ: tốt cho bộ nhớ đệm và trái với những gì nhiều DBA sẽ đề xuất, bạn có thể muốn RAID50 thay vì RAID10).

Tỷ lệ của hai là khó nói. Phụ thuộc vào những gì DB làm.

Bởi vì IO đọc ngẫu nhiên là trường hợp xấu nhất đối với bộ nhớ đệm, đó là nơi SSD thực sự thuộc về riêng nó - rất nhiều nhà sản xuất không bận tâm đến bộ nhớ cache SSD vì dù sao nó cũng có cùng tốc độ. Vì vậy, đặc biệt đối với những thứ như cơ sở dữ liệu và chỉ mục tạm thời, SSD mang lại lợi tức đầu tư tốt.


Cảm ơn, chúng tôi là 100% RAID10 vì chúng tôi tập trung vào cơ sở dữ liệu.
bíp bíp

Nó phổ biến, nhưng nó cũng là một ngụy biện. RAID10 thực sự khá lãng phí đối với khối lượng công việc chủ yếu ghi theo định hướng. RAID5 / RAID6 đã lưu trong bộ nhớ cache có mức ghi thấp hơn khi bạn thực hiện, ví dụ như viết các tệp nhật ký cơ sở dữ liệu.
Sobrique

3

Phân tích của bạn là khá chính xác.

Sử dụng một vài ổ cứng cho nhiều GB và nhiều ổ cứng cho một vài IOps.
Sử dụng một vài ổ SSD cho nhiều IOP và nhiều ổ SSD cho vài GB

Cái nào quan trọng hơn đối với bạn? Dung lượng là trình điều khiển chi phí lớn cho các giải pháp SSD, vì giá mỗi GB cao hơn nhiều. Nếu bạn đang nói về cơ sở dữ liệu 200 GB cần 4K IOP, một cặp SSD sẽ đưa bạn đến đó. Hoặc một mảng 24 ổ đĩa 15K, để lại cho bạn nhiều không gian để lưu trữ số lượng lớn.

Có bao nhiêu IOps mà bạn thực sự sẽ thoát khỏi những ổ SSD đó thay đổi rất nhiều dựa trên cơ sở hạ tầng lưu trữ (ewwhite sẽ giải thích về điều đó), nhưng thật hợp lý khi có được những loại tốc độ đó. Đặc biệt là với Raid10, nơi tính chẵn lẻ không được tính toán.


Cảm ơn vì bạn đã phản hồi! Có hợp lý để trộn ổ đĩa? Tức là thiết lập 4 ổ SSD cho các tác vụ định hướng hiệu suất, sau đó là một loạt ổ cứng để lưu trữ số lượng lớn?
bíp bíp

3
@Beepbeep Yep, nhưng lưu ý về sự đánh đổi. Rất nhiều iops sẽ tiêu tốn tài nguyên của bộ điều khiển, điều đó có nghĩa là bạn sẽ không nhận được thông lượng tuần tự tối đa từ các ổ cứng. Rất nhiều thông lượng tuần tự trên ổ cứng có thể vượt qua IO từ ổ SSD tăng độ trễ do tranh chấp kênh. Nếu điều đó quan trọng với bạn, nhưng chúng trên các kênh khác nhau.
sysadmin1138

0

Gần đây tôi đã xây dựng một cặp máy chủ lưu trữ cho chủ nhân của mình, sử dụng khung gầm Dell C2100, chạy FreeBSD 10.1 với mười hai ổ đĩa doanh nghiệp "SE" Western Digital "SE". Các ổ đĩa nằm trong một nhóm ZFS duy nhất bao gồm hai thiết bị ảo RAIDZ-2 6 ổ (vdevs). Đi kèm với hồ bơi là một cặp SSD Intel DC S3500 được siêu bảo vệ chống mất điện, chúng được sử dụng như cả SLOG và L2ARC. Tải thử nghiệm máy chủ này qua iSCSI, tôi đã có thể đạt 7500-8200 IOPS. Tổng chi phí của chúng tôi bao gồm các ổ đĩa cứng là khoảng $ 2700 mỗi máy chủ.

Trong thời gian các hệ thống dựa trên BSD này đang chạy, một trong các đơn vị SAN MSA2012i SAN của chúng tôi đã gặp phải hai lỗi bộ điều khiển và đơn vị MSA2012i khác của chúng tôi đã làm hỏng một khối lượng NTFS lớn cần 12 giờ ngừng hoạt động để sửa chữa.

Dell và HP bán cho bạn 10% phần cứng và 90% lời hứa hỗ trợ mà cuối cùng bạn không bao giờ có thể sử dụng.


Đây là sự thật ... Một phần trong tôi muốn giới thiệu máy chủ HP chạy ZFS (hoặc HĐH thiết bị dựa trên ZFS), vì nó sẽ hoạt động tốt hơn nhiều so với MSA / P2000 ... nhưng tôi không muốn tắt trên một tiếp tuyến.
ewwhite

Ồ tôi không có vấn đề gì với HP. HP và dell làm cho phần cứng máy chủ tuyệt vời. Thường tải tốt hơn so với một số khung gầm iStarUSA hoặc Norco whitebox. Nhưng khi nói đến các thiết bị quan trọng (SAN / NAS là rất quan trọng trong cuốn sách của tôi), tôi đề xuất một giải pháp với độ trong suốt nhất có thể. Thiết bị SAN là hộp đen lớn. Chúng hoạt động tuyệt vời cho đến khi chúng không hoạt động, và sau đó bạn lên **** lạch.
cực âm
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.