Chế độ nhân đôi RAM: Có đáng không?


18

Không thực sự quen thuộc với "Chế độ kênh nhân đôi" của Intel đối với thiết lập Máy chủ Blade (cơ sở dữ liệu OLTP MySQL nặng vừa phải điển hình của bạn chạy trên lưỡi kim loại trần; không có ảo hóa ngay bây giờ).

Từ các tài liệu Intel tôi đã có thể tìm thấy:

Sê-ri Bộ xử lý Intel Xeon 5500 và sê-ri Intel Xeon Bộ xử lý 5600 để hỗ trợ cấu hình các kênh DDR3 DIMM có sẵn trong cấu hình được nhân đôi. Cấu hình được nhân đôi là một hình ảnh dự phòng của bộ nhớ và có thể tiếp tục hoạt động mặc dù có các lỗi không thể sửa chữa lẻ tẻ. Phản chiếu kênh là một tính năng RAS trong đó hai hình ảnh dữ liệu bộ nhớ giống hệt nhau được duy trì, do đó cung cấp dự phòng tối đa.

Trên sê-ri Intel Xeon Bộ xử lý 5500 và bộ xử lý Intel Xeon Bộ xử lý 5600 sê-ri dựa trên bo mạch máy chủ Intel, việc phản chiếu được thực hiện trên các kênh. Các kênh hoạt động giữ hình ảnh chính và các kênh khác giữ hình ảnh thứ cấp của bộ nhớ hệ thống. Bộ điều khiển bộ nhớ tích hợp trong bộ xử lý Intel Xeon Bộ xử lý 5500 và Bộ xử lý Intel Xeon Bộ xử lý 5600 xen kẽ giữa cả hai kênh để đọc các giao dịch. Viết giao dịch được phát hành cho cả hai kênh trong trường hợp bình thường.

Tuy nhiên, tôi không thực sự chọn ra những gì họ đang nằm ở đây. Tôi mất một nửa dung lượng lưu trữ, nhưng tôi có được "dự phòng" bộ nhớ và có thể đạt được lợi ích hiệu suất đọc / ghi? Giống như RAID 1 cho RAM? Bất cứ ai có bất kỳ kinh nghiệm thực tế với cấu hình này?

Câu trả lời:


7

Cá nhân tôi sẽ sớm sử dụng một số hình thức phân cụm hơn là mức độ phục hồi phần cứng. Nó có ý nghĩa cho các thành phần giá rẻ như đĩa tăng gấp đôi trên chúng, nhưng bộ nhớ phản chiếu là một thứ tốt đẹp nhưng không hữu ích. Tôi có nghĩa là những gì nhiều khả năng thất bại; CPU, HĐH, phần mềm, mobo, PSU / s của bạn. Tôi sẽ sớm đưa tiền vào cụm.


1
Suy nghĩ của tôi chính xác: mặc dù chắc chắn hữu ích cho một điểm thất bại rất cụ thể, tôi có thể đánh dấu nhiều "hộp" HA khác bằng cách đi tuyến đường cụm với một hoặc hai lưỡi dao khác (và có thể là một khung gầm khác trong trung tâm dữ liệu khác).
gravyface

1
phân cụm sẽ không giúp bạn khi các tính toán phải được thực hiện đúng tiến độ hoặc trong một tineframe. Trong một số trường hợp, chuyển đổi dự phòng mất nhiều thời gian hơn thao tác cần thực hiện
Jim B

7

"RAID 1 cho RAM" là một mô tả chính xác. Theo kinh nghiệm của tôi, không có nhiều lợi ích về hiệu suất, nhưng tùy thuộc vào tốc độ xe buýt so với tốc độ của các mô-đun, số dặm của bạn có thể thay đổi.

Theo như sự dư thừa đi .. tốt, thường thì mô-đun trở nên tồi tệ.

Cá nhân, tôi tắt phản chiếu bất cứ khi nào tôi thấy nó được kích hoạt.


2
cảm ơn Shane Bao giờ làm bất kỳ điểm chuẩn trước / sau?
gravyface

@gravyface Không thể nói rằng tôi có, thật không may; chỉ không nhận thấy một hiệu suất rõ rệt khác nhau so với tắt (trên máy chủ cơ sở dữ liệu và máy chủ vm). Một số số cứng chắc chắn sẽ tốt đẹp.
Shane Madden

2
Tôi sẽ làm một số điểm chuẩn sau đó. Xem nếu nó làm cho một sự khác biệt. Không thể nói lợi ích sửa lỗi nghe có vẻ như là một lợi ích hữu hình, nhưng tôi tò mò muốn xem nó hoạt động như thế nào. Tôi sẽ đợi một vài ngày để có câu trả lời bổ sung và sau đó đánh dấu câu này đúng.
gravyface

Tôi thấy dimms trở nên tồi tệ một cách thất bại, tuy nhiên với kích thước của môi trường tôi sẽ thấy 1 dimm cứ sau 2 tuần (nói theo thống kê)
Jim B

4

Tôi đã đọc được rằng loại điều này (bạn cũng có thể làm điều đó với CPU) rất hữu ích trong các cụm siêu máy tính khổng lồ.

Một số trong các cụm này đang chạy rất nhiều máy nên sẽ có một lỗi máy cứ sau vài giờ. Nhanh hơn các công việc có thể hoàn thành. Điều đó thực sự làm rối tung tính toán. Thêm dự phòng như thế này vào mỗi nút có thể nhiều hơn gấp đôi thời gian giữa các lần thất bại.


Vì vậy, đây là công cụ cao cấp bây giờ nhỏ giọt xuống dòng chính, tôi lấy nó. Không thực sự thấy nhiều giá trị cho nhu cầu của tôi. Cảm ơn mặc dù.
gravyface

Vâng, nó là cao cấp. Đợi cho đến khi bạn nhận được CPU VÀ CPU MIRRORING (!) Cắm nóng trong máy tính;) Các máy tính lớn có thể chuyển sang một cpu khác khi không thành công.
TomTom

3

Chế độ bộ nhớ này thực sự được thiết kế cho các tình huống bạn cần tính sẵn sàng cao Bạn không nên thấy nhiều sự khác biệt về hiệu suất (vì việc mất một kênh có thể không đáng chú ý trong các hoạt động bình thường) tuy nhiên bạn thực sự mất rất nhiều ram. Khi bật chức năng phản chiếu, chỉ có một phần ba tổng bộ nhớ khả dụng vì hai khe DIMM là kênh chính, hai khe DIMM là kênh dự phòng và hai khe DIMM không được sử dụng. (ít nhất đó là cách nó hoạt động trên IBM)

Tôi thường khuyên bạn nên tắt nó đi (nếu bạn có một ứng dụng hoặc HĐH thích ram - và hãy đối mặt với nó: có cái nào không?) Hoặc tiết kiệm để nâng cấp lên chipset ex5 từ IBM (hp và những người khác sớm để làm theo với các dịch vụ tương tự) có thêm một thuyền tải QPI.

Thỉnh thoảng có "máy chủ này phải hoạt động bất kể số lượng phát bắn vào nó" và loại dự phòng này giúp ích. Bổ sung bạn đã mua ít hơn ram chất lượng xuất sắc, điều này có thể giúp bạn tiết kiệm từ màn hình xanh hoặc 2.


Vâng, không thấy nhiều nhu cầu cho việc này ngay bây giờ. Rõ ràng không ai thích thời gian chết, nhưng khi chúng tôi giải quyết vấn đề HA, chúng tôi sẽ xem xét việc phân cụm chắc chắn nhất.
gravyface

1
điều này để đáp lại "bạn thấy một DIMM xấu mỗi hai tuần" - bạn có thường xuyên thấy các DIMM xấu trong thời gian ân hạn không? Tôi không thể nhớ mình từng có RAM xấu khi sản xuất; Tôi thường nhận thấy nó trong vài giờ / ngày đầu tiên với khối lượng công việc điển hình.
gravyface

Kết quả của chúng tôi phản ánh tỷ lệ google thấy cs.toronto.edu/~bianca/ con / sigmetrics09.pdf . Chúng tôi có các máy chủ được cấu hình tương tự - các bảng được điền đầy đủ với nhiều độ mờ và các ứng dụng cần nhiều bộ nhớ. Khi nhìn vào 1 trong các môi trường vmware của tôi, tôi thấy 3 dimms xấu trên 18 hs22vs của IBM (324 dimms) Các máy chủ này đã hoạt động được khoảng một năm nay.
Jim B
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.