Về mặt toán học, làm thế nào để tính tỷ lệ phần trăm thời gian hoạt động dựa trên một số nút và tỷ lệ phần trăm thời gian hoạt động tương ứng của chúng?


11

Câu hỏi này là một câu hỏi toán học nhiều hơn một câu hỏi máy chủ, nhưng nó liên quan đến máy chủ mạnh mẽ.

Nếu tôi có một máy chủ mà tôi có thể đảm bảo 95% thời gian hoạt động và tôi sẽ đặt máy chủ đó trong một cụm 2, thì thời gian hoạt động sẽ là bao nhiêu? Bây giờ, giả sử tôi làm tương tự, nhưng tôi biến nó thành một cụm 3?

Chúng ta đừng xem xét những thứ như một điểm thất bại, mà hoàn toàn tập trung vào toán học ở đây. Một trong những điều làm cho điều này hơi phức tạp là nếu tôi có 2 máy chủ, thì khả năng cả hai đều tắt là 2 ^ 2, vì vậy đó là 1/4; hoặc cho 3 đó là 2 ^ 3, vì vậy 1/8. Xem xét tôi có thời gian chết 5% cho mỗi máy chủ này, liệu tổng số trung bình có phải là 1/8 của 5% đó không?

Làm thế nào bạn sẽ tính toán một cái gì đó như thế này?


"95% thời gian hoạt động" - thaaat là gì? Tôi biết 5 ngày hoặc 5 năm tăng giá là gì. 0,95 thời gian hoạt động là gì? Đơn vị nào?
poige

1
Tại sao bạn cần phải biết điều này? Trường hợp sử dụng là gì?
ewwhite

@poige Có lẽ, "95% thời gian hoạt động" có nghĩa là "thời gian hoạt động chiếm 95% thời gian", mặc dù nếu bạn quyết định nói xấu về nó, bạn có thể nói rằng mọi thứ đều có ~ 0% thời gian hoạt động vì nó sẽ không tồn tại .
Vụ kiện của Quỹ Monica

1) Có lẽ tác giả nên trả lời? ;) 2) Tôi nghĩ trước khi tính toán một cái gì đó tốt hơn để hiểu nó là gì. ;)
poige

Câu trả lời:


11

Thời gian hoạt động là một điều trơn trượt ... Nếu bạn muốn tính toán sự sẵn có của một dịch vụ thì đơn giản là

amount of time service is available
-----------------------------------   x 100
  amount of time that has passed 

Nếu bạn có một cụm cung cấp dịch vụ, thì khả năng dịch vụ trở nên không khả dụng sẽ giảm nhưng tính toán khả dụng (thời gian hoạt động) cho dịch vụ vẫn giữ nguyên.


8

Cơ hội để một máy chủ ngoại tuyến là (1 - 0,95) Cơ hội của cả hai máy chủ ngoại tuyến là (1 - 0,95) * (1 - 0,95) = 0,0025, v.v ...

Vì vậy, sử dụng mô hình của bạn và theo quan điểm toán học thuần túy, một hoặc cả hai máy chủ sẽ tăng 99,75% thời gian

Tuy nhiên, tôi không chắc chắn rằng sử dụng mô hình toán học như vậy là cách chính xác để giải quyết thời gian hoạt động tiềm năng của bạn vì có những yếu tố khác có thể ảnh hưởng đến nó, điều này phổ biến cho cả hai máy chủ, tức là 95% có thể là do 5% thời gian việc cắt điện sẽ ảnh hưởng đến các máy chủ CẢ nên việc có một cụm sẽ không có gì khác biệt


Chào Phil. Sức mạnh chắc chắn là một thành phần của sự sẵn có có thể được giảm thiểu bằng cách đặt các cài đặt trong nhiều giá đỡ và lấy nguồn từ các nguồn khác nhau, v.v. Ý tưởng hoàn toàn từ quan điểm toán học, vì rõ ràng có nhiều thành phần đi vào điều này hơn là chỉ một vài máy chủ :)
Jeroen Landheer

8
Vấn đề là, các tính toán trong câu trả lời này và của Jeroen chỉ hoạt động nếu thời gian lên là độc lập (theo nghĩa toán học). Nếu có mối tương quan (ví dụ: cáp nguồn cho cả hai giá đỡ) thì mọi thứ không đơn giản.
TripeHound

@TripeHound Đây là lý do tại sao tôi viết câu trả lời của mình :)
Seamus

5

Điều này phụ thuộc vào lý do tại sao máy chủ của bạn giảm 5% thời gian. Nếu bạn có sức mạnh 95% thời gian, nhưng máy chủ của bạn nếu không hoàn hảo, sau đó một máy chủ thứ hai tại cùng một vị trí không làm tăng thời gian hoạt động của mình ở tất cả : nếu một đi xuống, cả hai đi xuống. Đây là một ví dụ về những thất bại có tương quan . Có khả năng ít nhất một số thời gian chết của bạn là do lỗi ảnh hưởng đến tất cả các máy chủ cùng nhau (sức mạnh ...). Nhưng một số thời gian chết sẽ độc lậpgiữa các máy chủ. Nếu bạn muốn làm điều đó đúng cách, bạn nên giải quyết những điều này một cách riêng biệt. Vì vậy, bạn muốn tìm ra xác suất máy chủ 1 không có lỗi độc lập (p) và máy chủ 2 không có lỗi độc lập (q) và không có lỗi hệ thống nào giết chết cả (r). Sẽ là tương đối an toàn khi giả định rằng các lỗi này là độc lập và do đó bạn có thể nhân chúng lại với nhau: p q r là xác suất của một số máy chủ đang hoạt động.

Vấn đề là, bạn không thể sử dụng dữ liệu thời gian hoạt động thực tế để cung cấp cho bạn các giá trị cho p, q và r, ngoại trừ nếu bạn chỉ có máy chủ 1 và nó tăng 95% thời gian, thì p * r = 0,95.


5

Trước hết, tổng tính khả dụng hoặc thời gian hoạt động của một cụm phụ thuộc vào mức độ lớn của một phần của cụm cần thiết để hoạt động cho toàn bộ cụm được coi là 'lên'.

  • Là một máy hoạt động đủ? Điều đó có nghĩa là bất kỳ máy đơn lẻ nào cũng có thể tải đầy đủ nếu cần.
  • Có phải tất cả trong số họ cần phải hoạt động cùng một lúc? Đó là, không có dư thừa.
  • Hoặc có lẽ hai trong số ba trực tuyến là đủ? Điều này sẽ cho phép khối lượng công việc lớn hơn trường hợp đầu tiên.

Như bạn đã tìm ra, hai trường hợp đầu tiên khá đơn giản để tính toán. Đặt xác suất của một máy chủ trực tuyến tại bất kỳ thời điểm nào p = 0,95. Bây giờ, đối với ba máy chủ, xác suất tất cả chúng đều trực tuyến cùng một lúc là p 3 = 0,857375.

Trong trường hợp ngược lại, khi có ít nhất một máy hoạt động tại một thời điểm nhất định, việc tính toán sẽ dễ dàng hơn bằng cách đảo ngược vấn đề và xem xét xác suất của các máy đang ngoại tuyến . Xác suất để một máy duy nhất ngoại tuyến là q = 1- p = 0,05 và do đó xác suất tất cả chúng đều giảm cùng một lúc là q 3 = 0,000125, đưa ra xác suất 1- q 3 = 1- (1- p ) 3 = 0,999875 rằng ít nhất một là lên.

2 trong 3 trường hợp hơi khó tính. Có bốn tình huống có thể xảy ra khi có ít nhất hai trong số ba máy chủ hoạt động. 1) ABC tăng, 2) AB tăng, 3) AC tăng, 4) BC tăng. Các xác suất cho tất cả những điều này, tương ứng là ppp , ppq , pqpqpp . Vì các trường hợp không khớp nhau, nên các xác suất có thể được cộng lại với nhau, cho tổng A = p 3 + 3 p 2 q = 0,992750.

(Điều này có thể được mở rộng ra nhiều máy hơn. Các yếu tố là các hệ số nhị thức nổi tiếng , do đó, việc đếm các trường hợp khác nhau bằng tay hoạt động chủ yếu như một bài tập.)


Tất nhiên, các phép tính như thế này dễ xử lý hơn bằng cách sử dụng chương trình máy tính làm sẵn ... Ít nhất có thể tìm thấy một máy tính trực tuyến tại đây:
http://stattrek.com/online-calculator/binomial.aspx

Nhập các giá trị đầu vào: xác suất thành công = 0,95, số lần thử = 3, số lần thành công = 2, chúng tôi nhận được kết quả "Xác suất tích lũy: P (X ≥ 2) = 0,99275". Một số giá trị liên quan khác cũng được đưa ra và công cụ trực tuyến giúp bạn dễ dàng chơi với các số khác.


Và vâng, tất cả các giả định ở trên đều cho rằng các máy chủ bị lỗi một cách độc lập, đó là a) Tôi đã bỏ qua mọi vấn đề ảnh hưởng đến toàn bộ cụm, b) không có gì giống như lão hóa thành phần khiến máy chủ có thể thất bại hoặc gần như cùng một lúc.


3

Bạn có 5% thời gian chết cho mỗi máy chủ, vì vậy bạn nhân nó lên - 0,05 * 0,05 = 0,0025, mang lại cho bạn 1-0.0025 = 0,9975 -> 99% thời gian hoạt động. Với 3 máy chủ, bạn có 1-0.000125 = 0.999875> 99,9% thời gian hoạt động.

Tôi thường chiếm 97% khả dụng cho máy chủ độc lập (với ổ cứng và PSU dự phòng), cho> 99,9% cho 2N và> 99,99% cho dự phòng 3N.


3

Tôi đã thực hiện thêm một số hoạt động đào và tìm thấy mảnh ghép này.

Sử dụng ví dụ về máy chủ có độ khả dụng 95%, sau đó thêm máy chủ thứ hai sẽ tăng tính khả dụng lên: 95% + (1-95%) * 95% = 99,75%. Logic đằng sau điều này là khi máy chủ thứ 1 ngừng hoạt động (5% thời gian), máy chủ thứ hai vẫn tăng 95% thời gian.

Thêm máy chủ thứ 3 sẽ lặp lại theo cách này. Hai cái đầu tiên đã có sẵn 99,75%, vì vậy, thêm cái thứ ba sẽ là: 99,75% + (1-99,75%) * 95% = 99,9875%. Vân vân và vân vân. Điều này gần với câu trả lời của Phil, nhưng vẫn hơi khác một chút vì bạn cần lấy kết quả của lần lặp trước và sử dụng nó trong lần tiếp theo.

Đối với các thành phần phụ thuộc vào nhau, bạn chỉ cần nhân tỷ lệ phần trăm khả dụng, vì vậy nếu bạn có 2 thành phần khả dụng 50%, bạn có tổng số khả dụng 25% (tức là hệ thống chỉ hoạt động khi cả hai thành phần hoạt động.)


0

Giả sử thời gian hoạt động của mỗi máy chủ là độc lập với các máy chủ khác thì tổng thời gian hoạt động là

1 - (0,05) ^ n

Trong đó n là số lượng máy chủ Và 0,05 là xác suất ngừng hoạt động của một máy chủ

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.