Có một sự khác biệt quan trọng giữa làm cho một dịch vụ có tính sẵn sàng cao và làm cho một máy riêng lẻ có sẵn cao.
Trong hầu hết các trường hợp, mục tiêu là làm cho dịch vụ trở nên khả dụng cao và tính sẵn có của các máy riêng lẻ chỉ là một phương tiện để đạt được mục tiêu đó. Tuy nhiên, có giới hạn về mục tiêu bạn có thể đạt được bằng cách cải thiện tính khả dụng của từng máy.
Ngay cả khi bạn có thể lấy đi tất cả thời gian chết do cần cập nhật phần mềm, các máy riêng lẻ vẫn sẽ không khả dụng 100%. Do đó, để tăng tính khả dụng của dịch vụ trên mức khả dụng của từng máy bạn phải thiết kế dự phòng ở mức cao hơn. Câu cuối cùng của câu hỏi của bạn cho thấy rằng ít nhất về nguyên tắc bạn biết điều này.
Nếu bạn thiết kế một dịch vụ khả dụng hơn các máy riêng lẻ có thể cung cấp thì sẽ không còn áp lực để đạt được tính sẵn sàng cao của các máy riêng lẻ. Do đó, đối với các dịch vụ khả dụng cao, không cần phải tránh khởi động lại. Thay vào đó, bạn có thể hy sinh một số độ tin cậy của các máy riêng lẻ để tiết kiệm có thể được đưa vào các lĩnh vực khác, nơi bạn có thể đạt được mức độ tin cậy cao hơn nhiều.
Một khi hệ thống cấp cao được thiết kế để trở nên đáng tin cậy trong trường hợp các thành phần phần cứng riêng lẻ không thực hiện việc vá nhân thay đổi trực tiếp từ việc trở thành một lợi thế để trở thành rủi ro.
Đó là một rủi ro vì có thể có sự khác biệt tinh tế giữa hành vi của một máy được vá trực tiếp và một máy được khởi động với phiên bản kernel mới nhất. Điều này có thể giới thiệu một lỗi tiềm ẩn có thể gây ra sự cố ngừng hoạt động vào lần tới khi máy được khởi động lại. Rủi ro này được khuếch đại bằng cách khởi động lại để có được một bảng xếp hạng sạch sẽ được xem như là một phương pháp để giảm thiểu một số lần mất điện.
Một ngày nào đó bạn có thể bị cúp điện mà bạn nghĩ việc khởi động lại máy có thể giúp ích. Nhưng khi bạn khởi động lại, bạn sẽ gặp phải lỗi tiềm ẩn khiến máy không quay trở lại trạng thái mong muốn. Vá trực tiếp không phải là cách duy nhất xảy ra lỗi tiềm ẩn như vậy, nó cũng có thể xảy ra do một thứ gì đó tầm thường như một dịch vụ được kích hoạt thủ công và không bao giờ được cấu hình để khởi động trong khi khởi động hoặc được cấu hình để bắt đầu quá sớm. không đến do sự phụ thuộc không thỏa mãn.
Vì những lý do đó, một dịch vụ khả dụng cao thực sự có thể dễ dàng đạt được hơn với việc khởi động lại thường xuyên các máy riêng lẻ với tốc độ đủ chậm để bạn có thể phát hiện sự cố và tạm dừng chuỗi khởi động lại sau khi xảy ra sự cố.