MTTF, MTBF, MTBR và MTBF cho HP ProLiant Gen9


14

Tôi đã xem xét MTTF, MTBF, MTBR và MTBF để tìm ra các máy chủ HP Gen9 đang chạy trong môi trường sản xuất của chúng tôi.

Root câu hỏi của tôi, nên lo lắng hay không.

Tôi dường như không thể có được bất kỳ dữ liệu tốt vì mỗi máy chủ có một phần cứng.

Tại công ty cuối cùng của chúng tôi, chúng tôi đã chạy khoảng 2000 máy chủ dell r210 r410 r710 Tôi sẽ nói trung bình chúng tôi có khoảng 5 máy chủ mỗi ngày có một số lỗi. Vì vậy, khoảng 0,25% máy chủ đã gặp khó khăn và cần phải thay thế một phần trước khi có thể được sử dụng lại.

Công ty cuối cùng của tôi mọi thứ đều được thiết lập trong một cặp HA, cơ sở hạ tầng N + 2 nên không ảnh hưởng đến sản xuất. Chúng tôi đã có thể thay thế các máy chủ và tiếp tục đi

Tại văn phòng hiện tại của tôi, chúng tôi điều hành 9 máy chủ, (Hyper-V của HP Gen9, 56 VM), chúng tôi không có nhiều bộ phận thay thế trong tay, ngoài trung tâm dữ liệu không được quản lý, vì vậy nếu có gì đó chúng tôi phải lái xe khoảng 45 phút để thay thế bất cứ điều gì

CTO và quản lý CNTT của tôi dường như lo lắng, họ đã có khoảng 2,5 ngày ngừng hoạt động vào năm ngoái, tôi đã tăng cường chúng tôi cần phân cụm các máy chủ nhưng họ không thấy cần thiết.

Có sai hay đúng ở đây? Không chắc sẽ làm gì.

Tôi biết đó không phải trách nhiệm của mình nếu có gì đó xảy ra trên CTO. Đây là một công ty rất nhỏ chỉ có CTO, Giám đốc CNTT, bản thân tôi (dev ops) và 1 anh chàng trợ giúp.

Hơn tất cả kinh nghiệm trong việc điều hành một môi trường sản xuất, rất hạn chế, cách thiết lập rất nhiều thứ tôi sẽ gọi là cấp cơ sở, cả CTO và Quản lý CNTT của tôi đều không biết nhiều về việc phân cụm trước khi tôi đến đó. Họ đang ở giữa một dự án để thiết lập DR mà không cần HA, điều mà tôi đã chống lại nhưng bị mất.


HA tốn tiền. Có lẽ họ nghĩ rằng nó không đáng tiền.
Michael Hampton

Câu trả lời:


3

Đừng lo lắng về các số liệu MTTF, MTBF, MTBR và MTBF ... tại sao chúng lại áp dụng cho các chi tiết cụ thể của môi trường của bạn?

Các máy chủ có dự phòng nội bộ và có thể cực kỳ ổn định trong sản xuất. Nhưng điều đó phụ thuộc vào môi trường của bạn, mảng / thành phần đĩa, loại đĩa, số lượng RAM, cấu hình CPU, đặc tính nhiệt, công suất, v.v.

Sử dụng một số hình thức có tính sẵn sàng cao có thể làm giảm khả năng ngừng hoạt động và cung cấp cho bạn một nơi để thay đổi khối lượng công việc của bạn trong trường hợp thất bại.

Đây là một câu hỏi rủi ro tài chính và hoạt động.

Có lẽ chi phí gia tăng từ việc đi từ độc lập sang cụm là đủ cao để nó không có ý nghĩa kinh doanh? Có lẽ 2,5 ngày ngừng hoạt động (~ 99,3% khả dụng) là đủ tốt cho hoạt động của bạn. Bạn nên tập trung vào bảo vệ ngoại vi và sao lưu tốt. Tất cả các hệ thống HP Gen9 của bạn đang được bảo hành nhà sản xuất hiện nay, vì vậy bạn đừng có quyền truy cập đến các bộ phận. Nếu bạn có RAID, nguồn / quạt dự phòng và nguồn điện ổn định, bạn đã bao phủ những khu vực quan trọng nhất.

Hãy nghĩ về điều này từ góc độ tài chính và vạch ra những rủi ro, chi phí liên quan và cố gắng tạo ra một trường hợp kinh doanh hấp dẫn cho những gì bạn muốn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.