Các ổ đĩa doanh nghiệp có thể được thay thế một cách an toàn bởi gần / giữa đường trong một số tình huống?


22

Khi chỉ định máy chủ, như (tôi sẽ giả sử) nhiều kỹ sư không phải là chuyên gia về lưu trữ, tôi thường chơi nó an toàn (và có thể là nô lệ cho tiếp thị) bằng cách tiêu chuẩn hóa tối thiểu 10 nghìn ổ đĩa SAS (và do đó là " doanh nghiệp "nâng cấp với chu kỳ nhiệm vụ 24x7, v.v.) cho dữ liệu" hệ thống "(thường là hệ điều hành và đôi khi là ứng dụng) và bảo lưu việc sử dụng ổ đĩa trung bình 7.2k để lưu trữ dữ liệu phi hệ thống trong đó hiệu suất không đáng kể hệ số. Đây là tất cả các giả định đĩa 2,5 "(SFF), vì đĩa 3,5" (LFF) chỉ thực sự phù hợp với các yêu cầu IOP có dung lượng cao, dung lượng thấp.

Trong trường hợp không có lượng dữ liệu phi hệ thống khổng lồ, tôi thường đặt nó trên cùng một đĩa / mảng với dữ liệu hệ thống, nghĩa là máy chủ chỉ có 10k ổ đĩa (nói chung là loại "One Big RAID10" thiết lập những ngày này). Chỉ khi kích thước của dữ liệu phi hệ thống là đáng kể, tôi thường xem xét đưa nó vào một mảng riêng giữa các đĩa mid / midk 7.2k để giảm chi phí / GB.

Điều này khiến tôi tự hỏi: trong một số tình huống, những đĩa 10k trong mảng RAID10 có thể được thay thế bằng đĩa 7.2k mà ​​không có hậu quả tiêu cực đáng kể nào không? Nói cách khác, đôi khi tôi có quá nhiều thông tin (và giữ cho các nhà cung cấp phần cứng hài lòng) bằng cách bám vào tối thiểu 10k đĩa cấp "doanh nghiệp", hoặc có lý do chính đáng để luôn luôn giữ ở mức tối thiểu không?

Ví dụ: lấy một máy chủ hoạt động như một trình ảo hóa với một vài VM cho một công ty nhỏ điển hình (giả sử 50 người dùng). Công ty có các mẫu I / O trung bình không có yêu cầu đặc biệt. Điển hình là ngày 9-5, văn phòng Thứ Hai, với các bản sao lưu chạy trong vài giờ mỗi đêm. Máy ảo có thể là máy chủ DC và máy chủ tệp / in / ứng dụng. Máy chủ có một mảng RAID10 với 6 đĩa để lưu trữ tất cả dữ liệu (dữ liệu hệ thống và phi hệ thống). Đối với con mắt không phải là chuyên gia của tôi, có vẻ như các đĩa mid / nearline có thể hoạt động tốt. Lấy đĩa HP làm ví dụ:

  • Khối lượng công việc: Các đĩa giữa được đánh giá cho khối lượng công việc <40%. Với văn phòng chỉ mở cửa 9 giờ một ngày và I / O trung bình trong khoảng thời gian đó dường như không ở đâu gần mức tối đa, có vẻ như khối lượng công việc không chắc sẽ vượt quá 40%. Ngay cả với một vài giờ I / O dữ dội vào ban đêm để sao lưu, tôi đoán là nó vẫn sẽ dưới 40%
  • Tốc độ: Mặc dù các đĩa chỉ có 7,2k, hiệu suất được cải thiện bằng cách trải đều trên sáu đĩa

Vì vậy, câu hỏi của tôi: có hợp lý khi gắn tối thiểu 10k ổ đĩa SAS, hoặc là đĩa trung gian / gần 7.2k thực sự là quá đủ trong nhiều tình huống? Nếu vậy, làm thế nào để tôi đánh giá vị trí của dòng và tránh làm nô lệ cho sự thiếu hiểu biết bằng cách chơi nó an toàn?

Kinh nghiệm của tôi chủ yếu là với các máy chủ HP, vì vậy, những điều trên có thể có một chút HP nghiêng về nó, nhưng tôi cho rằng các nguyên tắc này khá độc lập với nhà cung cấp.


3
SFF 7.2k đĩa giữa không có ý nghĩa vì hạn chế về dung lượng và nhiệm vụ. Nếu bạn đang nói về thiết bị HP (chuyên môn của tôi) , ổ đĩa SAS 10 GB 900 GB và 1,2TB sẽ là lựa chọn tốt nhất nếu bạn không sử dụng SSD. Nếu bạn ở Mỹ, 900GB SAS sẽ là ~ 300-400 đô la nếu bạn có một nhà cung cấp tốt.
ewwhite

1
Khiếu nại ngữ pháp nhỏ: nếu bạn nói "thay thế X cho Y", điều đó có nghĩa là bạn đã bắt đầu với Y và đang thay thế bằng X.
pjc50

2
Chắc chắn bạn sống trong năm 2015? Bởi vì trong một số năm, ổ đĩa hệ điều hành của tôi là một ổ SSD nhỏ (tiết kiệm năng lượng, v.v.) và tôi cũng sẽ không chạm vào bất kỳ HD nào để có hiệu suất cao.
TomTom

1
@TomTom Không, tôi là năm 2016 :) Nói một cách nghiêm túc, tôi chưa thực sự xem xét nó. Như tôi đã nói trong bài viết của mình, nói chung tôi sẽ đi theo cách tiếp cận "một RAID 10 lớn", vì vậy HĐH sẽ tiếp tục ở đó. Việc tách hệ điều hành ra một ổ SSD riêng có vẻ lãng phí nếu không thực sự cần thiết. Tôi rất muốn nghe suy nghĩ của bạn. Bạn sẽ sử dụng một ổ SSD duy nhất hoặc một cặp nhân đôi? Có lẽ điều này sẽ tự tạo ra một câu hỏi SF tốt ...
dbr

1
Cặp nhân đôi cho hệ điều hành. HP thậm chí còn bán các ổ SSD dành riêng cho hệ điều hành / khởi động.
ewwhite

Câu trả lời:


25

Có một giao điểm thú vị của thiết kế máy chủ, công nghệ đĩa và kinh tế ở đây:

Xem thêm: Tại sao các đĩa Yếu tố hình thức lớn (LFF) vẫn còn khá phổ biến?

  • Việc di chuyển về phía máy chủ rackmount dày đặc và các máy chủ yếu tố hình thức nhỏ. Ví dụ: bạn không thấy nhiều dịch vụ tháp nữa từ các nhà sản xuất lớn, trong khi các dòng sản phẩm dày đặc hơn được sửa đổi thường xuyên hơn và có nhiều tùy chọn / tính sẵn có hơn.
  • Sự đình trệ trong phát triển đĩa 3,5 "doanh nghiệp (15k) - 600GB 15k 3,5" là khoảng lớn như bạn có thể đi.
  • Tiến bộ chậm trong dung lượng đĩa gần 2,5 "(7.2k) - 2TB là dung lượng lớn nhất bạn sẽ tìm thấy ở đó.
  • Tăng tính khả dụng và giá thấp hơn của SSD dung lượng cao.
  • Lưu trữ hợp nhất vào lưu trữ được chia sẻ. Khối lượng công việc một máy chủ yêu cầu công suất cao đôi khi có thể được phục vụ thông qua SAN.
  • Sự trưởng thành của mảng lưu trữ toàn flash và hybrid, cộng với dòng khởi động lưu trữ.

Trên đây là lý do tại sao bạn thường thấy các nhà sản xuất tập trung vào các máy chủ 1U / 2U với các ổ đĩa 8-24 2.5 ".

Các ổ đĩa 3,5 "dành cho các trường hợp sử dụng dung lượng cao IOP thấp (2TB +). Chúng tốt nhất cho các hộp lưu trữ ngoài hoặc bộ lưu trữ SAN phía trước bởi một số hình thức lưu trữ. Trong tốc độ 15k RPM của doanh nghiệp, chúng chỉ có sẵn tối đa 600GB.

Đĩa quay 2,5 "10k RPM dành cho nhu cầu IOPS cao hơn và thường có dung lượng lên tới 1,8TB.

Đĩa quay 2,5 "7,2k RPM là một cuộc gọi tồi vì chúng không cung cấp dung lượng, hiệu suất, tuổi thọ cũng như lợi thế về giá. sự khác biệt, ổ đĩa 900 GB là mua tốt hơn. Trong ví dụ của 1.8TB 10k SAS so với 2.0TB 7.2k SAS , giá cũng rất gần nhau. Bảo hành lần lượt là 3 năm và 1 năm.

Vì vậy, đối với máy chủ và bộ nhớ trong 2,5 ", hãy sử dụng SSD hoặc 10k. Nếu bạn cần nhu cầu dung lượng và có các ổ đĩa 3,5" có sẵn bên trong hoặc bên ngoài, hãy sử dụng 7.2k RPM.

Đối với các trường hợp sử dụng bạn đã mô tả, bạn không cấu hình quá mức các máy chủ. Nếu chúng có các ổ đĩa 2,5 ", bạn thực sự chỉ nên sử dụng 10k SAS hoặc SSD. Các đĩa giữa bị mất hiệu năng, dung lượng, bảo hành ngắn hơn đáng kể và sẽ không tiết kiệm nhiều chi phí.


Cảm ơn đã dành thời gian để đặt điều này cùng nhau. Tôi sẽ có cơ hội cho nó một vài suy nghĩ đúng đắn vào ngày mai. Chỉ cần nhìn nhanh vào giá, có vẻ như khoảng 30% nhảy vọt giữa 1TB 7.2k và 900GB 10k, không lớn (tôi sẽ ở Anh nếu có vấn đề). Có thể là một yếu tố nếu bạn có ngân sách eo hẹp mặc dù bạn đang cố gắng tiết kiệm hợp lý ở một số nơi và lựa chọn đĩa chỉ là một trong số đó. Tôi rất muốn nghe những gì bạn nghĩ về câu hỏi từ quan điểm thuần túy kỹ thuật.
dbr

Từ góc độ kỹ thuật, không có lợi thế cho đĩa 7200 RPM 2.5 ". Nếu chi phí có vẻ quá xa, hãy tiếp tục mua sắm. Có một chút khác biệt trong thị trường này. Nếu đây là cho mục đích đĩa khởi động, SSD là một lựa chọn tốt. Nhưng tôi không thể nghĩ ra bất kỳ lý do nào tôi sử dụng đĩa HP 7200 2.5 "trong máy chủ ngày hôm nay. Ngoài ra, hãy đọc phần quickspecs HP của bạn một cách chặt chẽ. Đường giữa có bảo hành ngắn hơn.
ewwhite

1
Nói chung câu trả lời này là tuyệt vời. Nhưng giống như với bất cứ điều gì khác, "nó phụ thuộc." Trong ví dụ về đĩa 900GB 10k so với 1TB 7200, đĩa 1TB sẽ chạy mát hơn và do đó có thể tồn tại lâu hơn và sẽ ít tốn kém hơn. Nếu bạn không cần hiệu suất bổ sung, thì thật lãng phí tiền, cả chi phí vốn ban đầu và hoạt động. Đối với một máy chủ, nó không quan trọng lắm. Trong 10, nó bắt đầu cộng lại.
Dan Pritts

2
Thực sự đĩa chạy chậm sẽ kéo dài hơn? Bất kỳ bài viết tôi đang thiếu?
vasin1987

2
Từ quan điểm của một nhà cung cấp / nhà sản xuất, có. Họ đang chỉ đạo bạn 10k và SSD 2,5" . Nếu bạn là người da trắng-boxing, đi 7200 RPM. Trong thực tế, ZFS tôi nhà cung cấp lưu trữ, PogoStorage , sử dụng 7200 RPM 2.5" cho ZFS họ mảng vì bộ nhớ đệm và SSD sắp xếp theo lớp loại bỏ cần phải xác định đĩa nhanh hơn.
ewwhite

5

Có ít nhất một vài điều có thể gây ra sự cố với MỘT SỐ loại ổ đĩa:

  • Các ổ đĩa không có nghĩa là để đối phó với tải rung của khung máy có nhiều ổ đĩa (không có vấn đề với bất kỳ ổ đĩa nào được chỉ định là có khả năng RAID / NAS)

  • Phần sụn không cho phép TLER hoặc cần cấu hình lại thủ công tốn thời gian của ổ đĩa để kích hoạt nó (ditto)

  • Các ổ đĩa chưa từng được thử nghiệm với bộ điều khiển RAID được sử dụng và có thể có các lỗi không nhận dạng được xuất hiện trong một thiết lập như vậy

  • Bộ nhớ ghi ổ đĩa nội bộ hoạt động theo cách (ghi vật lý không đúng thứ tự hoặc rất chậm trễ) gây ra nhiều nhầm lẫn trong trường hợp tắt máy cứng (Bộ điều khiển RAID nên được cấu hình để buộc các TẮT này. đó. Xem ổ đĩa chưa được kiểm tra :)

  • Ổ đĩa đôi khi có thể thực hiện các thói quen bảo trì nội bộ có thể khiến ổ đĩa hoạt động chậm hoặc phản hồi đủ chậm, để khiến bộ điều khiển RAID nghĩ rằng nó bị lỗi (liên quan đến TLER)

  • Nói chung, như thường được triển khai, SATA có ít biện pháp bảo vệ hơn so với SAS đối với ổ đĩa bị bắn hoàn toàn hoặc treo các thiết bị điện tử treo mọi thứ trên bộ điều khiển (không phải là rủi ro về mặt lý thuyết, một số kết hợp thương hiệu đĩa + bộ điều khiển thích chế độ thất bại đó).


1
Đây có vẻ là lý do để sử dụng các ổ đĩa đủ điều kiện với ngăn xếp ứng dụng và phần cứng máy chủ, nhưng không cụ thể là khoảng 10k so với 7k2 vòng / phút.
poolie

1
Câu hỏi có thể dễ dàng được hiểu ("?" Và "một cách an toàn" thường sẽ ngụ ý giải quyết các rủi ro mất dữ liệu hoặc thời gian ngừng hoạt động liên quan đến thất bại.
rackandboneman

4

HUGE vấn đề:

(Có thể hơi lạc đề một chút - nhưng tôi là người quan trọng! )

Khi bạn đang xử lý SSD - (như thường lệ, hoặc có thể là trường hợp hoặc cám dỗ) - rất nhiều SSD có vấn đề khó chịu khi chúng không thể luôn phục hồi sau khi mất điện tự phát!

Đây là một vấn đề nhỏ với ổ cứng. Các ổ cứng thường có đủ điện dung để cung cấp năng lượng cho logic của chúng và đủ động lượng góc để mang các đĩa thông qua việc hoàn thành việc viết một khối 512 byte - trong trường hợp mất điện giữa chừng. Một lần trong một thời gian hiếm hoi , điều này sẽ không hoạt động, dẫn đến một cái gì đó gọi là "viết rách" - trong đó một khối có thể được viết một phần. Việc ghi một phần (hiếm albiet) sẽ gây ra lỗi tổng kiểm tra trên khối - tức là khối riêng lẻ đó sẽ xấu. Điều này thường có thể được phát hiện là xấu bởi chính mạch đĩa và được sửa bởi bộ điều khiển RAID ngược dòng.

SSD là một động vật khác nhau. Việc thường thực hiện một cái gì đó gọi là "cân bằng hao mòn" - trong đó họ không chỉ viết "khối X" đến một vị trí thực tế cho "khối X" giống như ổ cứng. Thay vào đó, họ cố gắng viết vào các vị trí khác nhau trên phương tiện flash - và họ cố gắng tổng hợp hoặc kết hợp ghi (sử dụng một chút bộ đệm). Viết đến những nơi khác nhau liên quan đến việc giữ một "bản đồ" về nơi mà mọi thứ được viết, cũng được đệm và viết ra theo cách có nghĩa là để giảm mức độ hao mòn. Một phần của mức độ hao mòn thậm chí có thể liên quan đến việc di chuyển dữ liệu đã có trên thiết bị và thậm chí gần đây không được viết.

Vấn đề này là khi SSD mất nguồn - nó có rất nhiều dữ liệu trong bộ nhớ (không bị xóa), nó có một số dữ liệu được ghi ra các vị trí khác nhau / đã thay đổi - và nó có các bản đồ này trong bộ nhớ của chính nó. tuôn ra để làm cho bất kỳ ý nghĩa của cấu trúc của tất cả các dữ liệu trên thiết bị.

NHIỀU SSD không có logic hoặc mạch để có thể giữ cho bộ điều khiển của chúng hoạt động và tồn tại đủ lâu khi tự động tắt nguồn để xả tất cả dữ liệu này một cách an toàn trước khi nó chết. Điều này không chỉ có nghĩa là một khối bạn đã viết bây giờ có thể ở trong jeprody - nhưng các khối khác - thậm chí tất cả các khối trên thiết bị có thể gặp rắc rối. Nhiều thiết bị cũng gặp vấn đề khi chúng không chỉ mất tất cả dữ liệu trên thiết bị mà bản thân thiết bị cũng bị brick và không sử dụng được.

Đây hoàn toàn là lý thuyết đúng - nhưng (làm việc trong ngành lưu trữ) - Tôi / chúng tôi đã thấy điều này xảy ra quá nhiều lần trên đường quá nhiều thiết bị - kể cả trong một số máy tính xách tay cá nhân của chúng tôi!

Nhiều nhà cung cấp đã thảo luận làm "ổ SSD doanh nghiệp lớp" nơi đặc biệt thêm thiết bị ( "siêu mũ") và mạch khác để cho phép một "tuôn ra" sạch - nhưng đó là rất rất khó để tìm thấy bất kỳ thiết bị mà đặc biệt khẳng định như một phần của nó biểu dữ liệu có bảo vệ đầy đủ, rõ ràng, đã được kiểm tra khỏi các sự kiện đó và sẽ bảo vệ chống lại các sự kiện đó.

Rõ ràng nếu bạn mua "mảng lưu trữ cao cấp" từ nhà cung cấp hàng đầu sử dụng công nghệ flash, thì ổ đĩa của họ - hoặc toàn bộ hệ thống của họ đã được thiết kế với tất cả điều này trong tài khoản. Hãy chắc chắn rằng nó có!

Vấn đề liên quan đến câu hỏi của bạn là: Nếu bạn có một mảng RAID - và một số ổ đĩa là ổ SSD "xấu" mà không có sự bảo vệ này - nếu bạn bị "mất điện tự phát" - bạn có thể mất TẤT CẢ dữ liệu trên các đĩa MULTIPLE không thể tái tạo RAID.

"Nhưng tôi sử dụng một UPS"

Nói chung, điều quan trọng cần lưu ý là "mất điện tự phát" có thể bao gồm các tình huống như BSOD và khóa / sự cố / hoảng loạn hạt nhân - nơi bạn không có lựa chọn phục hồi bằng cách rút phích cắm trên hệ thống.


2
Rất hiếm khi ai đó sẽ rút phích cắm trên hệ thống treo (trừ khi nó đang dọn đĩa) đủ nhanh để không cho phép các loại đĩa bất kỳ xóa bộ nhớ cache của họ. Và trong trường hợp đó, các ổ cứng thông thường có bộ nhớ cache được kích hoạt có thể tạo ra cùng một mớ hỗn độn, mặc dù ít có khả năng bị brick nhưng vẫn có khả năng bị hỏng dữ liệu đáng kể - Reiserfs, NTFS sớm, chúng có xu hướng bị bắn từ đó vì chúng xử lý dữ liệu nhật ký được viết cho một hoạt động không thực sự xảy ra (hoặc ngược lại, cả hai đều có khả năng bị xóa bộ nhớ cache) RẤT tệ.
rackandboneman

2
SSD được thiết kế đúng sẽ không bị hỏng hoặc mất dữ liệu trong trường hợp dữ liệu chưa được xóa hoàn toàn. Vì vị trí vật lý của từng khu vực logic có thể thay đổi trên mỗi lần ghi, phiên bản trước đó của dữ liệu trong từng khu vực logic vẫn tồn tại trong trường hợp bản cập nhật chưa được xóa. Bạn vẫn có thể mất dữ liệu nếu phần sụn bị lỗi thiết kế hoặc lỗi triển khai.
kasperd

1
SSD tiêu dùng @kasperd được bán trên cơ sở tốc độ, họ thỏa hiệp để làm điều đó. Mặc dù có thể duy trì tính toàn vẹn theo cách bạn đề xuất, nhưng thực tế là hầu hết các nhà sản xuất đều lái xe (ít nhất là ở cấp độ người tiêu dùng) đơn giản là không. Ngoài ra, khi họ đến EoL, hầu hết đều không thất bại.
JamesRyan

@JamesRyan Câu chuyện về các nhà sản xuất gian lận với việc chuyển dữ liệu sang lưu trữ liên tục để đưa ra kết quả tốt hơn trong một số chỉ số hiệu suất không phải là mới. Chúng tôi đã nghe về điều đó xảy ra trong thời của đĩa cứng. Không phải vì đây là điều người tiêu dùng muốn. Đó là bởi vì người tiêu dùng chỉ nhìn thấy một số số liệu và không biết nhà sản xuất đã gian lận trong các lĩnh vực khác như thế nào để đạt được nó. Đôi khi các nhà sản xuất tránh xa sự gian lận, đôi khi họ không làm thế. (Tôi chắc chắn ai đó có thể đưa ra một sự tương tự xe hơi lấy cảm hứng từ những tin tức gần đây.)
kasperd

2
SSD là một động vật khác nhau. Họ có các bảng bản đồ cho biết dữ liệu ở đâu. Họ đang di chuyển và di chuyển dữ liệu và điều chỉnh các bản đồ này. Họ CẦN kết hợp các bài viết của họ (nghĩa là trì hoãn, bó chúng lại và viết sau) để tránh khuếch đại ghi. Bản đồ không thể được viết thành tích cực và cần tuân theo các quy tắc tương tự. Chúng ta có thể về "thiết kế phù hợp" và sai sót - nhưng SSD không phải là "đơn giản" như các hệ thống tập tin bị xáo trộn (không đơn giản). Tôi đang nói từ rất nhiều kinh nghiệm, thử nghiệm, thông số kỹ thuật và tôi có thể hoặc không thể nói chuyện với nhà sản xuất - hoặc hai - hoặc ba trong công việc của mình.
Brad
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.