Tài liệu ngừng hoạt động để xem xét sau khi chết


14

Chúng tôi đã bị mất điện khá nghiêm trọng trong tuần qua ảnh hưởng đến một số dịch vụ đưa chúng tôi ra khỏi SLA với khách hàng. Bây giờ mọi thứ đã được giải quyết, tôi đang tiến hành đánh giá sau khi chết.

Từ đánh giá này, tôi muốn đưa ra một tài liệu nội bộ mô tả sự cố mất điện, ảnh hưởng của nó, phản ứng của chúng tôi và giải pháp. Tôi muốn đưa ra một hình thức khá chuẩn để tái sử dụng trong tương lai. Tôi đã bao gồm những suy nghĩ của tôi dưới đây, nhưng những mục khác nên được bao gồm? Nếu đây là một sự cố liên quan đến an ninh, bạn sẽ thêm gì?

  • Tóm tắt Tóm tắt cấp điều hành của sự kiện.
  • Dịch vụ bị ảnh hưởng
  • Tác động Tác động đến người dùng và SLA của chúng tôi là gì? Có một chi phí về đồng đô la, giao dịch bị bỏ lỡ, mất khách hàng, vv?
  • Thời gian ngừng hoạt động Đối với mỗi dịch vụ bị ảnh hưởng nếu có phương sai
  • Nguyên nhân Bao gồm nguyên nhân chính và phụ
  • Nghị quyết
  • Dòng thời gian của sự kiện Thông báo, liên hệ với nhà cung cấp bên ngoài, thông báo của khách hàng, phản hồi, v.v.
  • Các vấn đề với phản ứng của chúng tôi Có phải mọi thứ không như kế hoạch với phản ứng của chúng tôi đối với việc ngừng hoạt động? Đúng người thông báo? Các nhà cung cấp đã đáp ứng các nghĩa vụ hợp đồng của họ?
  • Các biện pháp phòng ngừa cần thực hiện Làm thế nào để chúng tôi ngăn chặn sự cố mất điện này xảy ra lần nữa hoặc giảm tác động của nó?
  • Phương pháp phát hiện Chúng tôi đã phát hiện ra sự cố mất điện này như thế nào và làm thế nào để chúng tôi cải thiện việc phát hiện trong tương lai?
  • Thay đổi để thực hiện trong các phản ứng mất điện trong tương lai

Cố gắng giữ bài viết xuống một mục và giải thích, và bài đăng này có thể được cập nhật với các câu trả lời được bình chọn hàng đầu.

Câu trả lời:


6

Mặc dù có thể áp dụng các biện pháp phòng ngừa , tôi khuyên bạn nên có phần phương pháp Phát hiện mà bạn có thể sử dụng để lưu ý các triệu chứng thực sự là gì và làm thế nào bạn có thể phát hiện vấn đề (nhanh hơn) nếu xảy ra lần nữa, lý tưởng là sử dụng tự động hóa.


Đã thêm vào wiki
Doug Luxem

2

Có vẻ tốt. Tôi chỉ thêm vào như sau:

Ảnh hưởng / Hậu quả : Hậu quả của việc ngừng hoạt động - ai bị ảnh hưởng, SLA nào bị vi phạm (nếu có), có bất kỳ ảnh hưởng nào không?


1

Các dịch vụ bị ảnh hưởng và thời gian ngừng hoạt động chỉ cho bạn biết một phần của việc mất điện nghiêm trọng như thế nào. Bạn cũng muốn biết những tác động đến doanh nghiệp là gì.

Tác động : Điều này có ảnh hưởng gì đến người dùng và cảm nhận của nó như thế nào? Chúng tôi đã tốn bao nhiêu tiền (do mất SLA, mất đơn hàng, v.v.)?


Tôi thích sự khác biệt giữa các dịch vụ bị ảnh hưởng và tác động kinh doanh, nhưng tôi sẽ phân loại nó là "Tác động kinh doanh" và không chỉ là tác động (để phân biệt giữa nó và thông tin về thời gian / dịch vụ bị ảnh hưởng). Thêm vào đó, nó sẽ thu hút sự chú ý của quản lý, những người cần nhận thức được tác động kinh doanh, nếu không phải tất cả các chi tiết kỹ thuật về những dịch vụ bị ảnh hưởng ...
Milner

1

Phát hành công khai & phát hành nội bộ

Đây là một cái gì đó để quản lý quyết định nhưng bạn có thể bao gồm những gì nên được phát hành cho khách hàng về nó hoặc đề xuất của bạn nào. Ngoài ra, bằng cách nào đó, hãy đăng xuất khỏi ban quản lý về từ ngữ chính xác về những gì sẽ được phát hành cho khách hàng trước khi phát hành bất cứ điều gì.

Bản phát hành công khai nên được bao gồm trong này để bất kỳ ai trong công ty biết những gì họ được phép nói với khách hàng.


Tôi nghĩ rằng tài liệu nội bộ này có thể được sử dụng để tạo ra một bản phát hành bên ngoài cho khách hàng. Chính xác những gì sẽ được nói với khách hàng sẽ tùy thuộc vào giám đốc điều hành và tiếp thị / hoa hồng của chúng tôi.
Doug Luxem
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.