100% thời gian hoạt động cho một ứng dụng web


312

Chúng tôi đã nhận được một "yêu cầu" thú vị từ một khách hàng ngày hôm nay.

Họ muốn 100% thời gian hoạt động với chuyển đổi dự phòng ngoài trang web trên một ứng dụng web. Từ quan điểm của ứng dụng web của chúng tôi, đây không phải là một vấn đề. Nó được thiết kế để có thể mở rộng ra trên nhiều máy chủ cơ sở dữ liệu, v.v.

Tuy nhiên, từ một vấn đề mạng, tôi dường như không thể tìm ra cách làm cho nó hoạt động.

Tóm lại, ứng dụng sẽ sống trên các máy chủ trong mạng của khách hàng. Nó được truy cập bởi cả người bên trong và bên ngoài. Họ muốn chúng tôi duy trì một bản sao ngoài hệ thống của hệ thống mà trong trường hợp xảy ra sự cố nghiêm trọng tại cơ sở của họ sẽ ngay lập tức nhận và tiếp quản.

Bây giờ chúng tôi biết hoàn toàn không có cách nào để giải quyết nó cho người bên trong (chim bồ câu?), Nhưng họ muốn người dùng bên ngoài thậm chí không nhận thấy.

Thành thật mà nói, tôi không có ý tưởng sương mù nhất về cách điều này có thể có thể. Có vẻ như nếu họ mất kết nối Internet thì chúng ta sẽ phải thực hiện thay đổi DNS để chuyển tiếp lưu lượng truy cập đến các máy bên ngoài ... Tất nhiên, điều này sẽ mất thời gian.

Ý tưởng?

CẬP NHẬT

Tôi đã có một cuộc thảo luận với khách hàng ngày hôm nay và họ đã làm rõ về vấn đề này.

Họ bị mắc kẹt bởi con số 100%, nói rằng ứng dụng nên duy trì hoạt động ngay cả trong trường hợp lũ lụt. Tuy nhiên, yêu cầu đó chỉ có tác dụng nếu chúng tôi lưu trữ nó cho họ. Họ nói rằng họ sẽ xử lý yêu cầu thời gian hoạt động nếu ứng dụng sống hoàn toàn trên máy chủ của họ. Bạn có thể đoán phản ứng của tôi.


49
Đừng đánh giá thấp thời gian chết khổng lồ do hack, hãy nhìn vào Sony và mạng PlayStation. bạn có thể đảm bảo họ có cùng ý tưởng% 100 thời gian hoạt động và tiền / phần cứng để sao lưu. nói rõ với khách hàng rằng 100% thời gian hoạt động là một kỳ vọng không khả thi, ngay cả các công nghệ google cũng sẽ do dự để lẩm bẩm "100% thời gian hoạt động". Một gợi ý btw là xem xét sử dụng DNS động, họ chỉ lưu trữ trong 60 giây, điều này sẽ bao gồm hệ điều hành và máy chủ DNS cục bộ.
Silverfire

182
Cá nhân tôi sẽ CHẠY từ khách hàng này càng nhanh càng tốt. Tôi nghi ngờ đây sẽ không phải là ý tưởng điên rồ cuối cùng mà họ có thể có (từ quan điểm công nghệ).
GregD

137
Tôi ước tôi có thể downvote khách hàng của bạn.
joeqwerty

81
Nếu bạn tính ra 100% thời gian hoạt động hãy cho tôi biết. Tôi sẽ tạo một doanh nghiệp với nó và bán nó cho google. Không thể đảm bảo 100%. Ngay cả các công ty như microsoft, amazon hay google cũng sẽ không tăng cao vì họ biết điều đó là không thể. Điều tốt nhất tôi từng thấy là 99,999% và thậm chí đó là một sự kéo dài (5 phút trong một năm). Điều tốt nhất bạn có thể làm là đáng tin cậy 99,99%.
Matt

39
Chỉ cần tạo ra một thẻ giá cực kỳ cao để đưa vào yêu cầu điên rồ của họ. Điều đó có thể sẽ đưa họ trở lại với cảm giác của họ. Hoặc là, hoặc nó sẽ khiến họ rời đi tìm kiếm một người sẵn sàng nói dối họ.
Nate CK

Câu trả lời:


368

Dưới đây là biểu đồ tiện dụng của Wikipedia về việc theo đuổi số phận:

nhập mô tả hình ảnh ở đây

Thật thú vị, chỉ có 3 trong số 20 trang web hàng đầu có thể đạt được 5 số tiền thần thoại hoặc 99,999% thời gian hoạt động trong năm 2007. Họ là Yahoo, AOL và Comcast. Trong 4 tháng đầu năm 2008, một số mạng xã hội phổ biến nhất thậm chí không đến gần với điều đó.

Từ biểu đồ, rõ ràng việc theo đuổi 100% thời gian hoạt động là vô lý như thế nào ...


62
Pingdom cũng không kiểm tra mỗi giây. Trên hết, những dịch vụ đã gặp năm mức có thể vẫn có sự gián đoạn cục bộ mà Pingdom có ​​thể không phát hiện được, hoặc trục trặc khiến một số dịch vụ không khả dụng trong khi vẫn phản hồi ping.
ceejayoz

8
Mà trong và chính nó làm cho năm nines đáng ngờ ...
GregD

5
Đúng. Và họ đã có hàng tỷ đô la để làm việc!
ceejayoz

43
Xin lỗi vì làm phiền cuộc trò chuyện đang diễn ra, nhưng câu hỏi của OP là làm thế nào để phấn đấu hướng tới mục tiêu 100% thời gian hoạt động ở cấp độ kỹ thuật, tôi chắc chắn rằng anh ấy biết rằng không phải lúc nào cũng có thể xảy ra do phần cứng xảy ra với phần cứng và môi trường. Chúng ta có thể giúp anh ta với điều đó?
David d C e Freitas

5
Đối với OP: Tôi đã thấy SLA đảm bảo thời gian hoạt động trong bối cảnh "bên ngoài bảo trì bình thường". Việc bảo trì bình thường tất nhiên là thời gian ngừng hoạt động theo lịch mỗi tháng để cập nhật, vá lỗi, v.v., thường xảy ra vào ngày bận rộn nhất trong tháng của họ trong thời gian ít bận rộn nhất trong tháng (thường là vào giữa đêm). Họ phải có một số loại số liệu cho doanh nghiệp của họ liên quan đến kinh doanh. Bạn có thể cung cấp thời gian hoạt động tốt hơn (4 giờ) cho họ chỉ trong những khoảng thời gian đó.
GregD

186

Yêu cầu họ xác định 100% và cách đo nó trong khoảng thời gian nào. Họ có thể có nghĩa là gần 100% như họ có thể đủ khả năng. Cung cấp cho họ các chi phí.

Để công phu. Tôi đã thảo luận với khách hàng trong nhiều năm qua với các yêu cầu được cho là lố bịch. Trong mọi trường hợp, họ thực sự chỉ sử dụng ngôn ngữ không đủ chính xác.

Thông thường, họ đóng khung mọi thứ theo cách xuất hiện tuyệt đối - như 100% nhưng thực tế khi điều tra sâu hơn, họ đủ hợp lý để thực hiện các phân tích chi phí / lợi ích được yêu cầu khi đưa ra chi phí cho dữ liệu giảm thiểu rủi ro. Hỏi họ làm thế nào họ sẽ đo lường sự sẵn có là một câu hỏi quan trọng. Nếu họ không biết điều này thì bạn đang ở một vị trí phải đề nghị với họ rằng điều này cần được xác định trước.

Tôi sẽ yêu cầu khách hàng xác định điều gì sẽ xảy ra về mặt tác động / chi phí kinh doanh nếu trang web bị sập trong các trường hợp sau:

  • Vào giờ bận rộn nhất của họ trong x giờ
  • Ít nhất là số giờ bận rộn của họ trong x giờ

Và cũng là cách họ sẽ đo lường điều này.

Bằng cách này, bạn có thể làm việc với họ để xác định mức '100%' phù hợp. Tôi nghi ngờ bằng cách hỏi những loại câu hỏi này, họ sẽ có thể xác định tốt hơn các ưu tiên của các yêu cầu khác của họ. Ví dụ, họ có thể muốn trả một số mức SLA nhất định và thỏa hiệp các chức năng khác để đạt được điều này.


21
Đã đồng ý. Họ có thể chỉ có nghĩa là thời gian hoạt động "rất cao" (trên 90?) Với chiến lược chuyển đổi dự phòng khá vững chắc. Nếu không, thì một lời giải thích về quy mô chi phí có liên quan sẽ hy vọng thuyết phục được họ ...
Martin Dow

32
+1 vì không đi đến kết luận, và thay vào đó chỉ yêu cầu khách hàng giải thích những gì họ có trong đầu.
sleske

4
Tôi lặp lại tuyên bố "không đi đến kết luận" ... nếu khách hàng có nghĩa là 100% thời gian hoạt động (trừ bảo trì theo lịch trình) thì đó có thể là một yêu cầu hợp lý hơn.
Tim Reddy

1
Về tác động kinh doanh, chúng tôi thực sự biết và hiểu hoàn toàn về hoạt động kinh doanh của họ và các chi phí liên quan đến trang web đi xuống không phải là tài chính. Hơn nữa dọc theo dòng người bản địa xuất hiện với những cú ném bóng, treo cổ tiềm năng, v.v.) Chỉ cần tưởng tượng 40.000 người xuất hiện ở cửa trước của bạn la hét. Đó là những gì họ muốn tránh với một niềm đam mê.
NotMe

7
@ChrisLively Tất cả lý do nhiều hơn để có một sự hiểu biết trưởng thành về rủi ro sau đó. Mô hình chi phối cho kỹ thuật an toàn là đánh giá rủi ro xác suất . Có những hệ thống có thể giết chết (không chỉ gây khó chịu) cho hàng ngàn người và họ vẫn có tỷ lệ thất bại thấp, hy vọng được hiểu rõ, nhưng không phải là không.
poolie

140

Khách hàng của bạn là điên rồ. 100% thời gian hoạt động là không thể cho dù bạn chi bao nhiêu tiền cho nó. Đơn giản và đơn giản - không thể. Hãy nhìn vào Google, Amazon, v.v. Họ có số tiền gần như vô tận để ném vào cơ sở hạ tầng của họ và họ vẫn có thời gian chết. Bạn cần gửi thông điệp đó cho họ, và nếu họ tiếp tục khăng khăng rằng họ đưa ra những yêu cầu hợp lý. Nếu họ không nhận ra rằng một số lượng thời gian chết là không thể tránh khỏi, thì hãy bỏ qua.

Điều đó nói rằng, bạn dường như có cơ chế mở rộng / phân phối ứng dụng. Phần kết nối mạng sẽ cần liên quan đến các liên kết dự phòng đến các ISP khác nhau, nhận phân bổ ASN và IP, và tìm hiểu sâu về BGP và thiết bị định tuyến thực để không gian địa chỉ IP có thể di chuyển giữa các ISP nếu cần.

Đây rõ ràng là một câu trả lời rất ngắn gọn. Bạn chưa có kinh nghiệm với các ứng dụng yêu cầu mức độ thời gian hoạt động này, vì vậy bạn thực sự cần phải có một chuyên gia tham gia nếu bạn muốn đến bất cứ nơi nào gần với thời gian hoạt động 100% huyền thoại.


7
Đã đồng ý. Tổng cộng. Khùng.
jdw

2
họ đã từng ??
Sirex

2
@Sirex Đề cập đến thí nghiệm gần đây @ CERN nơi neutrino đã được tìm thấy di chuyển nhanh hơn ánh sáng. Kết quả chưa được xác nhận bởi các nhà khoa học độc lập mặc dù.
TC1

9
@ TC1 Tôi sẽ đặt cược cho bạn 200 đô la mà không hết.
dpatchery

4
@ErikA Yêu cầu 100% thời gian hoạt động là dấu hiệu cho thấy sự thiếu hiểu biết về các đặc tính kỹ thuật của hệ thống. Điều đó ổn, bởi vì công việc của khách hàng là làm bất cứ điều gì họ làm. Công việc của bạn là kỹ sư hệ thống CNTT. Những khách hàng khó tính như thế này có thể là ác mộng, nhưng họ cũng có thể trở thành khách hàng tốt nhất của bạn.
duffbeer703

54

Chà, đó chắc chắn là một điều thú vị. Tôi không chắc chắn tôi muốn bản thân có nghĩa vụ hợp đồng 100% thời gian hoạt động, nhưng nếu tôi phải nghĩ rằng nó sẽ trông giống như thế này:

Bắt đầu với IP công cộng trên một bộ cân bằng tải hoàn toàn ra khỏi mạng và xây dựng ít nhất hai trong số chúng để một cái có thể thất bại so với cái kia. Một chương trình như Heatbeart có thể giúp chuyển đổi dự phòng tự động.

Varnish chủ yếu được biết đến như một giải pháp bộ nhớ đệm nhưng nó cũng thực hiện một số cân bằng tải rất tốt. Có lẽ đó sẽ là một lựa chọn tốt để xử lý cân bằng tải. Nó có thể được thiết lập để có 1 đến n phụ trợ được nhóm tùy ý trong các giám đốc sẽ tải số dư ngẫu nhiên hoặc luân chuyển. Varnish có thể được thực hiện đủ thông minh để kiểm tra sức khỏe của mỗi đầu sau và thả các đầu sau không lành mạnh ra khỏi vòng lặp cho đến khi nó trở lại trực tuyến. Các phụ trợ không phải trên cùng một mạng.

Tôi rất thích các IP đàn hồi trong Amazon EC2 những ngày này vì vậy tôi có thể sẽ xây dựng các bộ cân bằng tải của mình trong EC2 ở các khu vực khác nhau hoặc ít nhất là ở các khu vực khả dụng khác nhau trong cùng khu vực. Điều đó sẽ cung cấp cho bạn tùy chọn thủ công (không cho phép) quay vòng cân bằng tải mới nếu bạn phải và di chuyển IP bản ghi A hiện có sang hộp mới.

Varnish không thể chấm dứt SSL, vì vậy, nếu đó là mối quan tâm bạn có thể muốn xem xét một cái gì đó như Nginx thay thế.

Bạn có thể có hầu hết các phụ trợ trong mạng khách hàng của mình và một hoặc nhiều bên ngoài mạng của họ. Tôi tin, nhưng không chắc chắn 100%, rằng bạn có thể ưu tiên các phụ trợ để máy khách của bạn sẽ được ưu tiên cho đến khi tất cả chúng trở nên không lành mạnh.

Đó là nơi tôi sẽ bắt đầu nếu tôi có nhiệm vụ này và chắc chắn sẽ tinh chỉnh nó khi tôi đi cùng.

Tuy nhiên, như @ErikA tuyên bố, đó là Internet và luôn có những phần của mạng nằm ngoài tầm kiểm soát của bạn. Bạn sẽ muốn đảm bảo rằng pháp lý của bạn chỉ ràng buộc bạn với những thứ nằm dưới sự kiểm soát của bạn.


2
Trong một thời gian, tôi đã suy nghĩ về Amazon và MS để triển khai đám mây nhưng cả hai đều gặp sự cố lớn trong vài tháng qua. SSL là rất quan trọng.
NotMe

3
Nếu bạn định sử dụng Amazon, bạn chắc chắn sẽ muốn trải rộng các máy của mình ra xung quanh 5 vùng khả dụng. Rất khó có khả năng tất cả các khu vực của họ sẽ ra ngoài cùng một lúc.
jdw

11
+1 để thực sự giải quyết câu hỏi chính của OP.
Phil

bạn sẽ luôn có một điểm thất bại, jdw, miễn là có một thứ không được phân phối trong chuỗi (trong trường hợp của bạn là nhịp tim, trừ khi tất nhiên bạn có nhiều trường hợp chạy trên các máy từ xa cũng giám sát lẫn nhau cũng như của bạn các máy chủ mà bất kỳ ai trong số họ có thể hoặc không thể thấy do sự cố mạng dọc theo định tuyến). Điều này đưa chúng ta đến "thời gian chết". Các máy chủ có thể hoạt động và vẫn không khả dụng cho máy khách mà không cần nhịp tim phát hiện ra nếu lỗi không nằm trong đường dẫn định tuyến.
jwenting

Đã đồng ý. Như MỌI NGƯỜI khác đã chỉ ra, không có thứ gọi là 100% thời gian hoạt động. Tất cả những gì bạn có thể làm là thử và những gì tôi mô tả là cách tôi sẽ bắt đầu thử.
jdw

30

Không có vấn đề - mặc dù từ ngữ hợp đồng sửa đổi một chút:

... Đảm bảo thời gian hoạt động là 100% (làm tròn đến số thập phân bằng 0).


2
+1 để ghi chú, 100% không phải là 100,0% hoặc 100.000%, v.v ... Các chữ số thập phân có vấn đề, chúng biểu thị độ chính xác;)
Thủy thủ Danubian

4
Theo một số quy ước, "100%" chỉ có một con số đáng kể, sao cho tất cả các số từ một nửa đến một sẽ làm tròn thành "100%"; 50% sẽ làm tròn đến 100%.
Thomas Levine

1
Tùy thuộc vào tiêu chuẩn để đếm, một số người sẽ nói rằng 50% có hai số đầy đủ trong đó 100% có ba số không chính xác. 50,5 và 100 là chính xác như vậy. Những người khác sẽ đếm chữ số sau dấu thập phân. Sau đó, 50,5 và 100,4 sẽ chính xác như vậy. Nếu không có gì khác tuyên bố tôi sẽ cho rằng 100% là 99,5% trở lên. 100,0% là 99,95% trở lên, v.v.
Tillebeck

26

Nếu Facebook và Amazon không thể làm điều đó, thì bạn không thể. Nó đơn giản như vậy.


17
anh ta có thể thông minh hơn tất cả những người của họ cộng lại, ai biết được: p
Matt

3
100% thời gian hoạt động không nhất thiết phải là những người theo nghĩa đen - điều đó có nghĩa là: 100% có sẵn trong thời gian cần thiết. Ví dụ, hệ thống ngân hàng phải luôn có sẵn và chúng hoạt động khá tốt. Chỉ vì họ xuống bảo trì 1 giây mỗi năm không có nghĩa là họ thất bại với mục tiêu 100% thời gian hoạt động.
David d C e Freitas

13
@DavidFreitas - Tôi nghĩ trong các hợp đồng, nó thường theo nghĩa đen ...
UpTheCux

2
@Matt chỉ vì Facebook / Amazon không thể làm điều đó không có nghĩa là một trang web nhỏ hơn không thể làm điều đó. Rất nhiều trang web lớn phải đối mặt với nhiều vấn đề khó khắc phục hơn một trang web nhỏ hơn.
Xorlev

1
Vì vậy, những gì bạn đang nói là bạn đã không có 100% thời gian hoạt động kể từ khi bạn có một số khách hàng gặp lỗi .. cộng với dns không phải là một chuyển đổi tức thời kể từ khi bạn có ISP mà bỏ qua các TTL ngắn
Mike

25

Để thêm câu trả lời của oconnore từ Hacker News

Tôi không hiểu vấn đề là gì. Khách hàng muốn bạn lên kế hoạch cho thảm họa và họ không định hướng toán học, vì vậy yêu cầu xác suất 100% nghe có vẻ hợp lý. Kỹ sư, như các kỹ sư có xu hướng làm, nhớ ngày đầu tiên của anh ta về prob & stat 101, mà không xem xét rằng khách hàng có thể không. Khi họ nói điều này, họ không nghĩ về mùa đông hạt nhân, họ đang nghĩ về việc Fred vứt cà phê của mình trên máy chủ văn phòng, bị hỏng đĩa hoặc ISP bị hỏng. Hơn nữa, bạn có thể thực hiện điều này. Với các máy chủ tự giám sát, độc lập, độc lập về mặt địa lý, về cơ bản bạn sẽ không có thời gian chết. Với 3 máy chủ hoạt động với độ tin cậy (1) ba 9 độc lập, với các chế độ chuyển đổi dự phòng tốt, thời gian ngừng hoạt động dự kiến ​​của bạn là dưới một giây mỗi năm (2). Ngay cả khi điều này xảy ra cùng một lúc, bạn vẫn ở trong một SLA hợp lý cho các kết nối web và do đó, thời gian chết thực tế không tồn tại. Khách hàng vẫn phải đối phó với các kịch bản ngày tận thế, nhưng Godzilla loại trừ, anh ta sẽ có một dịch vụ "luôn luôn" lên.

(1) Một máy chủ ở LA độc lập hợp lý với máy chủ ở Boston, nhưng vâng, tôi hiểu rằng có một số giao lộ liên quan đến chiến tranh hạt nhân, tin tặc Trung Quốc làm sập lưới điện, v.v. Tôi không nghĩ khách hàng của bạn sẽ buồn vì điều này.

(2) Chuyển đổi dự phòng DNS có thể thêm một vài giây. Bạn vẫn đang ở trong một kịch bản mà khách hàng phải thử lại yêu cầu mỗi năm một lần, một lần nữa, trong SLA hợp lý, và thường không được coi là cùng một lúc là "thời gian chết". Với một ứng dụng tự động định tuyến lại đến một nút có sẵn khi bị lỗi, điều này có thể không được chú ý.


6
Vấn đề là họ đang nói điều đó trong hợp đồng. Có nghĩa là nếu một thảm họa nào xảy ra và bạn cần hơn mười giây để đưa trang web trở lại trực tuyến thông qua các bản sao lưu mà họ sẽ phải đứng kiện.
Shadur

@Shadur: Nếu họ thực sự muốn nó, thì bạn phải thực sự tính phí cho họ. Truyền bá các máy chủ về địa lý xa và rộng, hy vọng sẽ không có thảm họa ở khắp mọi nơi.
Thợ săn rừng

3
Tôi đã thấy một trang web cung cấp đảm bảo 100% thời gian hoạt động hoặc tiền của bạn trở lại. Bí quyết là họ đã tính một tải thuyền và phân vùng thành nhiều tháng. Vì vậy, một số tháng không được trả tiền và bạn lên lịch mọi thứ xung quanh đó, và bù lỗ với những tháng làm việc ổn.
jldugger

17

Bạn đang được yêu cầu một cái gì đó không thể.

Xem lại các câu trả lời khác ở đây, ngồi xuống với khách hàng của bạn và giải thích TẠI SAO điều đó là không thể, và đánh giá phản ứng của họ.

Nếu họ vẫn khăng khăng 100% thời gian hoạt động, hãy lịch sự thông báo cho họ rằng không thể thực hiện và từ chối hợp đồng. Bạn sẽ không bao giờ đáp ứng nhu cầu của họ và nếu hợp đồng không hoàn toàn bị hút, bạn sẽ bị sai lệch với các hình phạt.


2
100% cần phải được xác định, tức là có sẵn 100% trừ khi thực hiện bảo trì hoặc nâng cấp và thời gian đó sẽ bị giới hạn ở mức yên tĩnh trong vài giờ một tháng. Tất cả phụ thuộc vào mục đích và cách sử dụng của ứng dụng web trong trường hợp này ...
David d C e Freitas

1
và định nghĩa "thời gian chết". Về mặt lý thuyết, thậm chí không thể đảm bảo rằng họ sẽ có thể truy cập máy chủ ở Omaha từ các văn phòng của họ ở Fairbanks trừ khi bạn kiểm soát toàn bộ mạng ở giữa (mặc dù bạn có thể đảm bảo về việc máy chủ đang hoạt động).
jwenting

Các định nghĩa là, IMHO, không liên quan nếu họ yêu cầu "100% thời gian hoạt động": Ngay cả khi bạn thương lượng bảo trì theo lịch trình và xây dựng dự phòng N + N nếu một trục trặc nhỏ gây ra khởi động lại không theo lịch trình hoặc nháy mắt dịch vụ bạn đã thổi SLA. Mặc dù có liên quan nếu bạn đang đàm phán SLA 3, 4 hoặc 5 nines.
voretaq7

Phụ thuộc vào các điều khoản của SLA, phải không? Nếu bạn được trả 100 nghìn đô la mỗi tháng và mỗi phút ngừng hoạt động sẽ bị phạt 1 nghìn đô la, điều đó hoàn toàn có thể thực hiện được (nếu bạn có các hợp đồng khác để khấu hao chi phí của các sysadins 24/7 tại chỗ).
Michael Borgwardt

@MichaelBorgwardt chắc chắn có những cách để "làm cho nó hoạt động" từ quan điểm số thuần túy, nhưng tôi vẫn từ chối vì tiềm năng cho PR xấu ($ _CLIENT đi trên Twitter và nói với thế giới rằng 'chúng tôi thất bại vì $ _PROVIDER không đủ năng lực và không thể gặp SLA của họ! '). Cá nhân tôi muốn có 10 khách hàng nhỏ hơn, hợp lý hơn trả cho tôi $ 10ka mỗi tháng :-)
voretaq7

13

Giá phù hợp, và sau đó quy định trong hợp đồng rằng bất kỳ thời gian chết nào qua SLA sẽ được hoàn trả theo tỷ lệ họ đang trả.

ISP tại công việc cuối cùng của tôi đã làm điều đó. Chúng tôi đã lựa chọn một đường DSL "thông thường" với 99,9% thời gian hoạt động với giá 40 đô la / tháng, hoặc bộ ba ngoại quan của T1 với 99,99% thời gian hoạt động với giá 1100 đô la / tháng. Có những lần mất điện thường xuyên hơn 10 giờ mỗi tháng, khiến thời gian hoạt động của họ thấp hơn mức DSL $ 40 / tháng, nhưng chúng tôi chỉ được hoàn lại khoảng 15 đô la hoặc hơn, vì đó là mức giá mỗi giờ * giờ kết thúc. Họ đã thực hiện như kẻ cướp từ thỏa thuận.

Nếu bạn lập hóa đơn 450.000 đô la một tháng cho 100% thời gian hoạt động và bạn chỉ đạt 99,999%, bạn sẽ cần hoàn lại cho họ $ 324. Tôi sẵn sàng đặt cược chi phí cơ sở hạ tầng để đạt 99,999% trong khu vực 45.000 đô la một tháng với giả định colos được phân phối đầy đủ, nhiều liên kết cấp 1, phần cứng ưa thích, v.v.


3
Nếu bạn thấy bất cứ ai hứa hẹn 100% thời gian hoạt động thì đây chính xác là những gì họ đang làm. Có một sự khác biệt giữa hứa hẹn 100% thời gian hoạt động và cung cấp nó. Sẽ là một ý tưởng tốt để giải thích điều này cho khách hàng nếu họ cố gắng trích dẫn SLA của đối thủ cạnh tranh với bạn.
sjbotha

10

Nếu các chuyên gia đặt câu hỏi nếu 99.999 phần trăm khả dụng [là] có khả năng thực tế hay khả thi về tài chính hay không , thì khả năng sẵn sàng 99.9999% thậm chí còn ít khả thi hoặc thực tế hơn. Hãy để một mình 100%.

Bạn sẽ không đáp ứng mục tiêu khả dụng 100% trong một khoảng thời gian dài. Bạn có thể thoát khỏi nó trong một tuần hoặc một năm, nhưng sau đó điều gì đó sẽ xảy ra và bạn sẽ phải chịu trách nhiệm. Sự ra đi có thể từ danh tiếng bị tổn hại (bạn đã hứa, bạn đã không giao hàng) đến phá sản từ tiền phạt theo hợp đồng.


10

Có hai loại người yêu cầu 100% thời gian hoạt động:

  1. Những người hoàn toàn không có kiến ​​thức về máy tính, hệ thống máy tính hoặc Internet. *
  2. Những người cố tình tự lừa mình, để kiểm tra khả năng của bạn để nói Không (Google "Thử nghiệm nước cam") hoặc cố gắng đạt được một loại đòn bẩy SLA hợp đồng nào đó để thoát khỏi việc trả tiền cho bạn sau này.

Lời khuyên của tôi, đã chịu đựng cả hai loại khách hàng này trong nhiều trường hợp, là không lấy khách hàng này. Hãy để họ lái xe người khác điên.

* Người này cũng có thể không bối rối khi tìm hiểu về du lịch nhanh hơn ánh sáng, Chuyển động vĩnh viễn, Fusion lạnh, v.v.


2
+1 cho bài kiểm tra nước cam .. Tôi thích và không biết về nó :)
Oliver M Grech

8

Tôi sẽ liên lạc với khách hàng để thiết lập với họ chính xác thời gian hoạt động chính xác 100%. Có thể họ không thực sự thấy sự khác biệt giữa 99% thời gian hoạt động và 100% thời gian hoạt động. Đối với hầu hết mọi người (ví dụ: không phải quản trị viên máy chủ) hai số đó là như nhau.


6

100% thời gian hoạt động?

Đây là những gì bạn cần:

Nhiều máy chủ DNS (& dự phòng), trỏ đến nhiều trang web trên toàn thế giới, với SLA phù hợp với mỗi ISP.

Đảm bảo rằng các máy chủ DNS được thiết lập đúng, với hiệu quả được nhận dạng bằng TTL.


1
Có, DNS là một khởi đầu tốt - ví dụ: nslookup google.comtrả về 6 IP khác nhau để dự phòng trong trường hợp một số trong số chúng không hoạt động. Ngoài ra, hãy xem RobTex.com một trang web tuyệt vời để xem cấu hình của một số tên miền nhất định, ví dụ: robtex.com/dns/google.com.html#records
David d C e Freitas

6

Điều này thật dễ dàng. Amazon EC2 SLA nêu rõ:

Tỷ lệ phần trăm thời gian hoạt động hàng năm của trực tiếp được tính bằng cách trừ 100% phần trăm thời gian 5 phút trong Năm dịch vụ mà Amazon EC2 ở trạng thái Vùng không có sẵn.

http://aws.amazon.com/ec2-sla/

Chỉ cần xác định 'thời gian hoạt động' là tương đối với toàn bộ gói dịch vụ mà bạn thực sự có thể duy trì hoạt động 100% thời gian và bạn sẽ không gặp vấn đề gì.

Ngoài ra, đáng để chỉ ra rằng toàn bộ quan điểm của SLA là xác định nghĩa vụ của bạn là gì và điều gì xảy ra nếu bạn không thể đáp ứng chúng. Sẽ không có vấn đề gì nếu khách hàng yêu cầu 3 số tiền phạt hoặc 5 số tiền phạt hoặc một triệu số tiền phạt - câu hỏi là họ nhận được gì khi / nếu bạn không thể giao hàng. Câu trả lời rõ ràng là cung cấp một chi tiết đơn hàng cho thời gian hoạt động 100% với mức giá gấp 5 lần bạn muốn tính phí và sau đó họ sẽ được hoàn lại gấp 4 lần nếu bạn bỏ lỡ mục tiêu đó. Bạn có thể ghi bàn!


5

Thay đổi DNS chỉ mất thời gian nếu chúng được cấu hình để mất thời gian. Bạn có thể đặt TTL trên một bản ghi thành một giây - vấn đề duy nhất của bạn là đảm bảo rằng bạn cung cấp phản hồi kịp thời cho các truy vấn DNS và máy chủ DNS có thể đối phó với mức truy vấn đó.

Đây chính xác là cách GTM hoạt động trong F5 Big IP - DNS TTL theo mặc định được đặt thành 30 giây và nếu một thành viên của cụm cần tiếp quản, DNS sẽ được cập nhật và IP mới được đưa lên gần như ngay lập tức. Tối đa 30 giây ngừng hoạt động, nhưng đó là trường hợp cạnh, trung bình sẽ là 15 giây.


10
Theo kinh nghiệm của tôi, một số máy chủ DNS sẽ bỏ qua một TTL mà họ cho là thấp đến mức đáng ghét (mặc dù RFC). Bất cứ điều gì ít hơn 5 phút trở nên không đáng tin cậy trong quy mô toàn cầu.
jdw

13
@Paul bỏ qua thực tế không phải là một thực tế có thể chấp nhận được, bất kể nó làm mọi người bực mình đến mức nào.
MDMarra

5
Tôi với jdw về điều này. Tôi đã thấy nhiều máy chủ DNS hoàn toàn bỏ qua TTL, thậm chí cài đặt 1 giờ và mặc định trở lại một cái gì đó như 24 giờ hoặc lâu hơn.
NotMe

6
@Paul - OP không có quyền kiểm soát đối với mọi bộ phân giải DNS của ISP trên hành tinh. Ergo, họ không có lựa chọn để nói "nếu bạn sẽ sử dụng trang web của chúng tôi, đừng sử dụng Comcast / Roadrunner / bất cứ ai làm ISP của bạn vì họ sẽ bỏ qua cài đặt TTL của chúng tôi". Đó là thứ gì đó đơn giản nằm ngoài tầm kiểm soát của họ và do đó quá mong manh để được coi là giải pháp cho vấn đề này IMHO. Giải pháp phải bao gồm một số cách để có thể buộc các IP xung quanh mà không cần dựa vào các bit khác của mạng có thể không hợp tác.
jdw

3
Điều đó giống như không có UPS vì nguồn điện 'chỉ nên hoạt động'. Đó không phải là một cách suy nghĩ chuyển tiếp để kiến ​​trúc sư một hệ thống. Nếu bạn biết rằng có một phần dễ vỡ của hệ thống, vì bất kỳ lý do gì, bạn nên cố gắng tính đến nó.
jdw

5

Bạn biết điều này là không thể.

Không còn nghi ngờ gì nữa, khách hàng tập trung vào việc xem "100%", vì vậy điều tốt nhất bạn có thể làm là hứa 100%, ngoại trừ [tất cả các nguyên nhân hợp lý không phải là lỗi của bạn].


Không có nghi ngờ khách hàng không muốn bất kỳ giải pháp. Họ muốn một sự suy giảm. Vì vậy, họ có thể nói, họ đã cố gắng ít nhất.
mbx

Vâng, có lẽ. Bạn đang giả định một mức độ cao của đầu mối.
Marcin

4

Mặc dù tôi nghi ngờ 100% là có thể, bạn có thể muốn coi Azure (hoặc một cái gì đó có SLA tương tự) là một khả năng. Điều gì xảy ra:

Máy chủ của bạn là máy ảo. Nếu có sự cố phần cứng trên một máy chủ, máy ảo của bạn sẽ được chuyển sang một máy mới. Bộ cân bằng tải đảm nhiệm việc chuyển hướng để khách hàng không thấy bất kỳ thời gian chết nào (mặc dù tôi không chắc trạng thái phiên của bạn sẽ bị ảnh hưởng như thế nào).

Điều đó nói rằng, ngay cả với thất bại này, sự khác biệt giữa 99.999 và 100 biên giới về sự điên rồ.

Bạn sẽ phải kiểm soát hoàn toàn các yếu tố sau.
- Yếu tố con người, cả bên trong và bên ngoài, cả ác ý và bất lực. Một ví dụ về điều này là ai đó đang đẩy một cái gì đó vào mã sản xuất đưa xuống một máy chủ. Tệ hơn nữa, còn việc phá hoại thì sao?
- Vấn đề kinh doanh. Điều gì sẽ xảy ra nếu nhà cung cấp của bạn hết thời gian hoặc quên thanh toán hóa đơn điện của họ, hoặc đơn giản là quyết định ngừng hỗ trợ cơ sở hạ tầng của bạn mà không có cảnh báo đầy đủ?
- Thiên nhiên. Điều gì xảy ra nếu các cơn lốc xoáy không liên quan đồng thời tấn công đủ các trung tâm dữ liệu để áp đảo khả năng sao lưu?
- Một môi trường hoàn toàn không có lỗi. Bạn có chắc chắn không có trường hợp cạnh với một số bên thứ ba hoặc kiểm soát hệ thống cốt lõi không tự thể hiện nhưng vẫn có thể làm như vậy trong tương lai?
- Ngay cả khi bạn có toàn quyền kiểm soát các yếu tố trên, bạn có chắc phần mềm / người giám sát việc này sẽ không cung cấp cho bạn âm tính giả khi kiểm tra xem hệ thống của bạn có hoạt động không?


2
Azure và EC2 gần đây đã gần hoàn thành và thất bại hoàn toàn. Tôi tin rằng Azure gần đây đã bị gỡ xuống chỉ vì một mục cấu hình xấu trên máy chủ DNS. Dù bằng cách nào, cảm ơn thông tin.
NotMe

và nếu bộ cân bằng tải của bạn (không chuyển đổi) không được chú ý (màn hình của nó cũng có thể không được chú ý, ad infinitum) khi nút bị hỏng, bạn vẫn bị vặn.
jwenting

1
Tôi nghĩ bạn có nghĩa là 'bất tài.' "Bất lực" không nên có tác động lớn đến khả năng thực hiện công việc của nhân viên CNTT.
mfinni

4

Thành thật 100% là hoàn toàn điên rồ mà không có ít nhất một người do dự về các cuộc tấn công hack. Đặt cược tốt nhất của bạn là làm những gì Google và Amazon làm trong đó bạn có một giải pháp lưu trữ được phân phối theo địa lý nơi bạn có trang web và DB được nhân rộng trên nhiều máy chủ ở nhiều vị trí địa lý. Điều này sẽ đảm bảo nó trong bất cứ điều gì ngoại trừ một thảm họa lớn như đường trục internet bị cắt đến một khu vực (xảy ra theo thời gian) hoặc một cái gì đó gần như tận thế.

Tôi sẽ đưa ra một điều khoản cho những trường hợp như vậy (DDOS, cắt xương sống internet, tấn công khủng bố tận thế hoặc một cuộc chiến lớn, v.v.).

Khác với điều đó nhìn vào các dịch vụ đám mây của Amazon S3 hoặc Rackspace. Về cơ bản, thiết lập đám mây sẽ không chỉ cung cấp dự phòng ở từng vị trí mà còn cả khả năng mở rộng và phân phối lưu lượng địa lý cùng với khả năng chuyển hướng xung quanh các khu vực địa lý bị lỗi. Mặc dù hiểu biết của tôi là phân phối địa lý tốn nhiều tiền hơn.


3

Tôi chỉ muốn thêm một giọng nói khác với "nó có thể bên (trên lý thuyết) được thực hiện".

Tôi sẽ không tham gia một hợp đồng có quy định này cho dù họ trả cho tôi bao nhiêu, nhưng như một vấn đề nghiên cứu, nó có một số giải pháp khá thú vị. Tôi không đủ quen thuộc với mạng để phác thảo các bước, nhưng tôi tưởng tượng sự kết hợp của các cấu hình liên quan đến mạng + lỗi dây điện / phần cứng + lỗi phần mềm, có thể, trong một số cấu hình hoặc công việc khác thực sự sẽ tắt nó.

Hầu như luôn luôn có một điểm thất bại duy nhất ở bất kỳ cấu hình nào, nhưng nếu bạn làm việc đủ chăm chỉ, bạn có thể đẩy điểm thất bại đó thành một thứ có thể được sửa chữa "trực tiếp" (tức là root dns bị hỏng, nhưng các giá trị vẫn được lưu trữ mọi nơi khác để bạn có thời gian sửa nó).

Một lần nữa, không nói điều đó là khả thi .. Tôi chỉ không thích làm thế nào mà không một câu trả lời nào đề cập đến thực tế rằng đó không phải là "lối thoát" - đó không phải là điều họ thực sự muốn nếu họ nghĩ đến.


3

Nghĩ lại phương pháp đo lường tính khả dụng của bạn sau đó làm việc với khách hàng của bạn để đặt các mục tiêu có ý nghĩa .

Nếu bạn đang chạy một trang web lớn, thời gian hoạt động không hữu ích chút nào. Nếu bạn bỏ truy vấn trong 10 phút khi khách hàng của bạn cần chúng nhất (cao điểm lưu lượng truy cập), điều đó có thể gây hại cho doanh nghiệp hơn là mất điện kéo dài một giờ vào lúc 3 giờ sáng Chủ nhật.

Đôi khi các công ty web lớn đo lường tính khả dụng hoặc độ tin cậy bằng cách sử dụng các số liệu sau:

  1. phần trăm truy vấn được trả lời thành công mà không có lỗi phía máy chủ (HTTP 500s).
  2. tỷ lệ truy vấn được trả lời dưới độ trễ mục tiêu nhất định .
  3. truy vấn bị bỏ sẽ được tính theo số liệu thống kê của bạn (xem bên dưới).

Tình trạng sẵn có nên không được đo bằng thiết bị thăm dò mẫu, đó là những gì một thực thể bên ngoài như Pingdom và pingability có thể báo cáo. Đừng chỉ dựa vào điều đó. Nếu bạn muốn làm đúng, mỗi truy vấn sẽ được tính . Đo lường sự sẵn có của bạn bằng cách nhìn vào thành công thực tế, nhận thức của bạn.

Cách hiệu quả nhất là thu thập nhật ký hoặc số liệu thống kê từ bộ cân bằng tải của bạn và tính toán tính khả dụng dựa trên các số liệu ở trên.

Tỷ lệ truy vấn bị bỏ cũng sẽ được tính vào số liệu thống kê của bạn. Nó có thể được tính trong cùng một nhóm như lỗi phía máy chủ. Nếu có vấn đề với mạng hoặc với cơ sở hạ tầng khác như DNS hoặc bộ cân bằng tải, bạn có thể sử dụng toán đơn giản để ước tính số lượng truy vấn bạn đã mất . Nếu bạn mong đợi các truy vấn X cho ngày đó trong tuần nhưng bạn đã nhận được X-1000, có lẽ bạn đã bỏ 1000 truy vấn. Vẽ lưu lượng truy cập của bạn vào các biểu đồ truy vấn mỗi phút (hoặc giây). Nếu khoảng trống xuất hiện, bạn bỏ các truy vấn. Sử dụng hình học cơ bản để đo diện tích của những khoảng trống đó, cung cấp cho bạn tổng số truy vấn bị bỏ.

Thảo luận về phương pháp này với khách hàng của bạn và giải thích lợi ích của nó. Đặt đường cơ sở bằng cách đo tính khả dụng hiện tại của chúng. Họ sẽ trở nên rõ ràng rằng 100% là mục tiêu không thể.

Sau đó, bạn có thể ký hợp đồng dựa trên những cải tiến trên đường cơ sở. Giả sử, nếu họ hiện đang trải nghiệm 95% khả dụng, bạn có thể hứa sẽ cải thiện tình hình gấp mười lần bằng cách đạt tới 98,5%.

Lưu ý: có những nhược điểm đối với cách đo lường tính khả dụng này. Đầu tiên, tự mình thu thập nhật ký, xử lý và tạo báo cáo có thể không tầm thường, trừ khi bạn sử dụng các công cụ hiện có để thực hiện. Thứ hai, lỗi ứng dụng có thể làm tổn thương tính khả dụng của bạn. Nếu ứng dụng có chất lượng thấp, nó sẽ phục vụ nhiều lỗi hơn. Giải pháp cho vấn đề này là chỉ xem xét số 500 được tạo bởi bộ cân bằng tải thay vì những thứ đến từ ứng dụng.

Mọi thứ có thể hơi phức tạp theo cách này, nhưng đó là một bước ngoài việc đo thời gian hoạt động của máy chủ .


3

Trong khi một số người lưu ý ở đây, 100% là điên rồ hoặc không thể , bằng cách nào đó họ đã bỏ lỡ điểm thực sự. Họ lập luận rằng lý do cho điều này là thực tế là ngay cả những công ty / dịch vụ tốt nhất cũng không thể đạt được nó.

Chà, nó đơn giản hơn thế nhiều. Về mặt toán học là không thể .

Mọi thứ đều có xác suất. Có thể có một trận động đất đồng thời tại tất cả các địa điểm nơi bạn lưu trữ máy chủ của mình, phá hủy tất cả chúng. Có thể đó là một xác suất nhỏ đến mức nực cười, nhưng không phải là 0. Tất cả các nhà cung cấp internet của bạn có thể phải đối mặt với một cuộc tấn công khủng bố / mạng đồng thời. Một lần nữa, không có nhiều khả năng, nhưng cũng không phải là không. Bất cứ điều gì bạn cung cấp, bạn đều có thể có được một kịch bản xác suất khác không, điều này sẽ làm giảm toàn bộ dịch vụ. Bởi vì điều này, thời gian hoạt động của bạn không thể là 100%.


Trên thực tế, tôi sẽ đi qua điên rồ hoặc không thể và gọi nó là ngu ngốc. Không có gì con người biết là 100%.
tăng gấp bốn lần

2

Đi lấy một cuốn sách về kiểm soát chất lượng sản xuất bằng cách sử dụng lấy mẫu thống kê. Một cuộc thảo luận chung trong cuốn sách này, các khái niệm mà bất kỳ nhà quản lý nào sẽ được tiếp xúc trong một khóa học thống kê chung ở trường đại học, đã đưa ra các chi phí để đi từ 1 bài trừ trong một nghìn, đến 1 phần nghìn đến 1 trong một triệu 1 trong một tỷ tăng theo cấp số nhân. Về cơ bản, khả năng đạt 100% thời gian hoạt động sẽ tiêu tốn một lượng tiền gần như không giới hạn, giống như lượng nhiên liệu cần thiết để đẩy một vật thể tới tốc độ ánh sáng.

Từ góc độ kỹ thuật hiệu suất, tôi sẽ từ chối yêu cầu là không thể kiểm chứng và không hợp lý, rằng biểu hiện này là một mong muốn nhiều hơn là một yêu cầu thực sự. Với các phụ thuộc ứng dụng tồn tại bên ngoài bất kỳ ứng dụng nào để kết nối mạng, phân giải tên, định tuyến, lỗi được hỗ trợ từ các thành phần kiến ​​trúc cơ bản hoặc các công cụ phát triển, nó trở thành một điều không thể thực tế khi có bất kỳ ai đảm bảo 100% thời gian hoạt động.


1

Tôi không nghĩ rằng khách hàng thực sự yêu cầu 100% thời gian hoạt động, hoặc thậm chí 99,999% thời gian hoạt động. Nếu bạn nhìn vào những gì họ đang mô tả, họ sẽ nói về việc chọn nơi họ rời đi nếu một thiên thạch lấy ra trung tâm dữ liệu tại chỗ của họ.

Nếu yêu cầu là người bên ngoài thậm chí không nhận thấy, làm thế nào quyết liệt phải được? Việc thực hiện yêu cầu Ajax thử lại và hiển thị một công cụ quay vòng trong 30 giây cho người dùng cuối có được chấp nhận không?

Đó là những điều khách hàng quan tâm. Nếu khách hàng thực sự nghĩ về SLA chính xác, thì họ sẽ biết đủ để thể hiện nó là 99,99 hoặc 99,999.


Nếu khách hàng nghĩ rằng họ muốn "100% thời gian hoạt động" và đó là khi kết thúc hợp đồng, bạn có thể bị giữ nếu nó kết thúc tại tòa án. Tốt nhất nên nói ra và giúp khách hàng hiểu họ thực sự muốn gì thay vì cho rằng bạn biết họ đang nghĩ gì.
Chris S

Oh tôi đồng ý điều này cần phải được làm rõ trước khi nó được ký kết hợp đồng. Tôi chỉ nói rằng điều này cần được tiếp cận vì khách hàng không truyền đạt những gì họ thực sự muốn, trái ngược với khách hàng đang yêu cầu một điều gì đó vô lý.
Kevin Peterson

1

2 xu của tôi. Tôi chịu trách nhiệm cho một trang web rất phổ biến cho một công ty fortune-5, người sẽ đưa ra quảng cáo cho siêu bát. Tôi đã phải đối phó với lưu lượng truy cập lớn và cách tôi giải quyết là sử dụng một dịch vụ như Akamai. Tôi không làm việc cho Akamai nhưng tôi thấy dịch vụ của họ cực kỳ tốt. Họ có hệ thống DNS thông minh hơn, thông minh hơn với một nút / máy chủ cụ thể đang bị tải nặng hoặc bị ngừng hoạt động và có thể định tuyến lưu lượng phù hợp.

Điều thú vị về dịch vụ của họ là tôi thực sự không phải làm gì quá phức tạp để sao chép nội dung trên các máy chủ trong trung tâm dữ liệu của riêng tôi sang trung tâm dữ liệu của họ. Ngoài ra, tôi biết khi làm việc với họ, họ đã sử dụng rất nhiều máy chủ HTTP Apache.

Mặc dù không phải 100% thời gian hoạt động, bạn có thể xem xét các tùy chọn như vậy để phân tán nội dung trên toàn thế giới. Theo tôi hiểu, Akamai cũng có khả năng bản địa hóa ý nghĩa giao thông nếu tôi ở Michigan, tôi nhận được nội dung từ máy chủ Michigan / Chicago và nếu tôi ở California, tôi đã nhận được nội dung từ máy chủ có trụ sở tại California.


-1 bởi vì đây là một câu trả lời thực tế nhưng không hữu ích chút nào. Tất cả các câu hỏi trong trang web này có thể được trả lời bằng cách "thuê người khác làm việc đó", nhưng đó không phải là lý do tại sao chúng tôi ở đây.
Yves Junqueira

Tôi có ý kiến ​​khác. "Không hữu ích chút nào?" Nó chắc chắn hữu ích cho tôi và trái với nhận xét "thuê người khác làm việc đó", tôi cho rằng với lý do của bạn, anh chàng nên tự đào cáp quang và tự thiết kế công tắc thay vì mua chúng? Bạn có nghiêm túc không, Yves? Bạn có vẻ như một người không dành nhiều thời gian trong lĩnh vực CNTT.
Kilo

0

Thay vì chuyển đổi dự phòng ngoài trang web, chỉ cần chạy ứng dụng từ hai vị trí đồng thời, bên trong và bên ngoài. Và đồng bộ hóa hai cơ sở dữ liệu ... Sau đó, nếu nội bộ đi xuống, những người bên trong vẫn có thể làm việc và những người bên ngoài vẫn có thể sử dụng ứng dụng. Khi nội bộ trở lại trực tuyến, đồng bộ hóa các thay đổi. Bạn có thể có hai mục nhập DNS cho một tên miền hoặc thậm chí bộ định tuyến mạng với vòng tròn.


0

Đối với các trang web được lưu trữ bên ngoài, thời gian hoạt động gần nhất 100% sẽ lưu trữ trang web của bạn trên Máy ứng dụng của Google và sử dụng kho dữ liệu sao chép cao (HRD) , tự động sao chép dữ liệu của bạn qua ít nhất ba trung tâm dữ liệu trong thời gian thực. Tương tự, các máy chủ ngoại vi của Máy ứng dụng được tự động thu nhỏ / sao chép cho bạn.

Tuy nhiên, ngay cả với tất cả các tài nguyên của Google và nền tảng tinh vi nhất trên thế giới, bảo đảm thời gian hoạt động của SLA của App Engine chỉ là "99,95% thời gian trong bất kỳ tháng nào theo lịch".


0

Đơn giản và trực tiếp: Anycast

http://en.wikipedia.org/wiki/Anycast

Đây là những gì mà cloudflare, google và bất kỳ công ty lớn nào khác sử dụng để thực hiện dự phòng, độ trễ thấp, thất bại / cân bằng xuyên lục địa.

Nhưng cũng nên nhớ rằng không thể có 100% thời gian hoạt động và chi phí phải trả từ 99.999% đến 99.9999% là lớn hơn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.