Khi viết của tôi, tôi luôn luôn viết thành hai ba bộ. Danh sách kiểm tra được thực hiện, với phần phụ lục RẤT NHIỀU về kiến trúc của hệ thống bao gồm lý do tại sao mọi thứ được thực hiện theo cách của chúng, các điểm dính có thể xảy ra khi trực tuyến và các giả định thiết kế trừu tượng. theo sau là một danh sách các vấn đề có thể xảy ra và các giải pháp của họ, tiếp theo là phần dài hơn với thông tin về cách thức hoạt động của một hệ thống, tại sao nó lại như vậy và thông tin khác hữu ích để chỉ cho mọi người đi đúng hướng.
Ở công việc cuối cùng của chúng tôi, chúng tôi được yêu cầu viết tài liệu để những người trợ giúp cấp 1 thậm chí có thể mang mọi thứ trở lại. Danh sách kiểm tra cần thiết này, thường đã hết hạn trong vòng 3 tháng sau khi viết. Chúng tôi được khuyến khích viết hướng dẫn xử lý sự cố bất cứ khi nào có thể, nhưng khi cây dự phòng có nhiều hơn ba nhánh trong đó, bạn không thể viết tài liệu đó mà không đi trừu tượng.
Khi rời khỏi công việc cuối cùng của mình, tôi đã lật lại 100 trang 'hướng dẫn cách làm công việc của mình' trước khi tôi rời đi. Nó có những thứ trừu tượng trong đó, triết lý thiết kế, cũng như các điểm tích hợp. Vì tôi có lẽ đang viết cho một sysadmin khác, người sẽ thay thế tôi, tôi đã nhắm nó vào một người có thể có những khái niệm trừu tượng và biến chúng thành những hành động cụ thể.
Năm năm đã trôi qua và tôi thấy ý kiến của mình về điều này đã thay đổi phần nào. Cả Tài liệu dưới dạng Thủ công và Tài liệu dưới dạng Danh sách kiểm tra đều có những vị trí rất có giá trị trong hệ thống phân cấp tài liệu và cả hai đều cần được sản xuất. Họ nhắm mục tiêu đối tượng rất khác nhau, mặc dù.
Tài liệu dưới dạng Danh sách kiểm tra
Thị trường mục tiêu của loại tài liệu này là các đồng nghiệp muốn làm thế nào để làm một việc. Chúng có hai loại:
- Đồng nghiệp, những người chỉ muốn biết cách làm một việc và không có thời gian để xem qua hướng dẫn mười lăm trang và tự mình tìm ra các bước.
- Các thủ tục khá phức tạp trong các bước, nhưng chỉ cần được chạy một lần trong một thời gian.
Thiếu kiên nhẫn là người lái xe cho loại đầu tiên. Có thể đồng nghiệp của bạn không thực sự muốn biết lý do tại sao đầu ra phải được chuyển qua biểu thức chính quy perl 90 ký tự, chỉ là nó phải có để đóng vé. Chắc chắn bao gồm một câu như "Để được giải thích chi tiết về lý do tại sao quy trình công việc này trông như thế này, hãy theo liên kết này", trong danh sách kiểm tra cho những người muốn biết tại sao.
Điểm thứ hai là về các quy trình không chạy thường xuyên nhưng chứa những cạm bẫy. Danh sách kiểm tra hoạt động như một bản đồ để tránh Doom nhất định chỉ lướt qua nó. Nếu danh sách kiểm tra được giữ trong một tài liệu repo, nó sẽ tiết kiệm được việc tìm kiếm email trong thời gian quản trị viên cũ gửi một CÁCH.
Theo tôi tài liệu kiểm tra danh sách tốt cũng bao gồm các phần về các điểm thất bại có thể, và phản ứng với những thất bại đó. Điều này có thể làm cho tài liệu khá lớn và kích hoạt phản hồi TL; DR ở đồng nghiệp, vì vậy tôi thấy rằng việc tạo các chế độ thất bại và phản hồi của chúng là một liên kết từ danh sách kiểm tra thay vì trên chính trang đó tạo ra một danh sách kiểm tra không chính đáng. Ôm siêu văn hóa.
Tài liệu làm thủ công
Thị trường mục tiêu cho loại tài liệu này là những người muốn tìm hiểu thêm về cách hệ thống hoạt động. Tài liệu kiểu cách làm nên có thể được lấy từ tài liệu này, nhưng thông thường hơn tôi thấy nó là phần bổ sung cho tài liệu kiểu danh sách kiểm tra để sao lưu các quyết định đưa ra trong quy trình làm việc.
Đây là tài liệu mà chúng tôi bao gồm các phần nhai như:
- Giải thích tại sao nó được cấu hình theo cách này.
- Phần này có thể bao gồm các vấn đề phi kỹ thuật như chính trị xung quanh cách toàn bộ thứ được mua và cài đặt.
- Giải thích các chế độ thất bại phổ biến và phản ứng của họ.
- Giải thích bất kỳ thỏa thuận cấp độ dịch vụ nào, cả bằng văn bản và trên thực tế.
- De facto: "nếu điều này thất bại trong tuần chung kết thì đó là vấn đề của mọi thứ. Nếu trong kỳ nghỉ hè, hãy quay lại giấc ngủ và giải quyết nó vào buổi sáng."
- Đặt ra các mục tiêu nâng cấp và tái cấu trúc.
- Chính trị có thể khác sau này, tại sao chúng ta không sửa một số ý tưởng tồi được đưa ra lúc đầu?
Tất cả đều rất hữu ích để có được sự hiểu biết toàn diện về toàn bộ hệ thống. Bạn không cần một sự hiểu biết toàn diện để chạy các nhiệm vụ tự động hóa đơn giản của con người, bạn cần nó để tìm ra lý do tại sao một cái gì đó đã phá vỡ nó và có một ý tưởng để làm cho nó không làm điều đó một lần nữa.
Bạn cũng đã đề cập đến tài liệu Phục hồi thảm họa phải là một danh sách kiểm tra.
Tôi hiểu, bạn có cảm tình của tôi.
Có, tài liệu DR không cần phải giống như danh sách kiểm tra càng tốt.
Có, tài liệu DR có khả năng chống lại danh sách kiểm tra nhất do có bao nhiêu cách để mọi thứ có thể phá vỡ.
Nếu danh sách kiểm tra DR của bạn trông giống như:
- Gọi Dustin hoặc Karen.
- Giải thích vấn đề.
- Đứng lại.
Bạn có một vấn đề. Đó không phải là một danh sách kiểm tra, đó là một sự thừa nhận rằng sự phục hồi của hệ thống này rất phức tạp, cần một kiến trúc sư để tìm ra. Đôi khi đó là tất cả những gì bạn có thể làm, nhưng cố gắng tránh nó nếu có thể.
Tài liệu DR lý tưởng chứa danh sách kiểm tra thủ tục cho một vài thứ khác nhau:
- Thủ tục xử lý để tìm ra những gì đã sai, điều này sẽ giúp xác định ...
- Thủ tục phục hồi cho các trường hợp thất bại nhất định. Được hỗ trợ bởi ...
- Kịch bản phục hồi được viết tốt trước để giúp giảm thiểu lỗi của con người trong quá trình khôi phục.
- Tài liệu hướng dẫn sử dụng về các trường hợp thất bại, tại sao chúng xảy ra và ý nghĩa của chúng.
Thủ tục xử lý đôi khi là tất cả các tài liệu DR bạn có thể thực hiện cho một số hệ thống. Nhưng có nó có nghĩa là cuộc gọi 4 giờ sáng sẽ trở nên dễ hiểu hơn và kỹ sư cao cấp thực hiện việc khôi phục sẽ có thể giải quyết vấn đề thực tế nhanh hơn.
Một số trường hợp thất bại có quy trình phục hồi thẳng. Tài liệu cho họ. Trong khi ghi lại chúng, bạn có thể tìm thấy các trường hợp trong đó danh sách các lệnh đang được nhập theo một thứ tự cụ thể, đây là trường hợp sử dụng tuyệt vời để viết kịch bản; nó có thể biến thủ tục phục hồi 96 điểm thành 20 điểm. Bạn sẽ không bao giờ biết liệu bạn có thể viết kịch bản gì đó cho đến khi bạn lập bản đồ hành động của quy trình khôi phục bằng hành động.
Tài liệu hướng dẫn sử dụng cho các trường hợp thất bại là điểm dừng cuối cùng được sử dụng khi không có quy trình khôi phục hoặc quy trình khôi phục không thành công. Nó cung cấp các gợi ý google cần thiết để có thể tìm người khác gặp vấn đề đó và họ đã làm gì để khắc phục nó.