Là giám sát Nagios trên mạng qua mạng WAN lý tưởng?


8

Mới bắt đầu ở một công ty mới và một nhiệm vụ đầu tiên của tôi là tìm kiếm các lựa chọn thay thế cho hệ thống giám sát kênh của họ.

Giải pháp hiện tại của họ là một ứng dụng .Net kiểm tra các thiết bị khác nhau qua mạng LAN (vì chúng là một công ty tư vấn CNTT cung cấp hỗ trợ / "bảo trì" 24/7). Các thiết bị bao gồm từ bộ định tuyến / chuyển mạch / máy in đến máy chủ và dịch vụ MS.

Sau khi đọc vô số bài đăng trên trang web và googling rộng rãi, có vẻ như sự đồng thuận là một số loại hỗn hợp Nagios / Munin là cách để đi.

Điều này đưa tôi đến (các) câu hỏi của tôi:

A) Có thể có một máy chủ Nagios chạy tại địa phương tại công ty và giám sát các trang web bên ngoài khác nhau qua mạng WAN không? (Họ không muốn có máy chủ Nagios cục bộ trên mỗi trang vì hầu hết các trang đều tương đối nhỏ (10-25 máy chủ) và số lượng trang web khá lớn (75-100)).

B) Nếu vậy các đại lý sẽ liên lạc với phụ trợ Nagios như thế nào? Thông qua SSH? HTTP?

C) Bên cạnh thực tế là nó có thể dễ bị lỗi liên kết mạng WAN, những nhược điểm trước mắt của giải pháp đó là gì?

Bất kỳ phản hồi nào đều được đánh giá cao và tôi xin lỗi trước vì bất kỳ quan niệm sai lầm nào vì tôi còn khá mới đối với ngành.

Câu trả lời:


6

Giám sát qua mạng WAN là có thể, nhưng nói chung là không lý tưởng. Điều này là do nếu liên kết WAN bị hỏng hoặc làm mờ tất cả các kiểm tra sẽ thất bại và bạn sẽ mù quáng với những gì đang xảy ra ở vị trí xa. Bạn cũng đã tăng độ trễ làm cho nó ít hữu ích hơn cho các phép đo hiệu suất của LAN View. Điều đó được nói rằng nếu bạn đang đi theo cách này, bạn có thể muốn thiết lập các phụ thuộc để bạn không bị ngập trong các cảnh báo khi liên kết WAN có vấn đề.

Cách phổ biến nhất mà tôi đã thấy giao tiếp giữa một hệ thống giám sát và các dịch vụ được giám sát của nó là có một đường hầm VPN tại chỗ. Sau đó, giao tiếp không khác với mạng cục bộ. Ngoài ra, Nagios thường dựa trên Pull (mặc dù không cần phải như vậy). Vì vậy, Nagios liên lạc với các dịch vụ và máy chủ mà nó giám sát, không phải theo cách khác.

Cuối cùng, một giải pháp lý tưởng hơn là sử dụng thiết lập giám sát phân tán, với tùy chọn Nagios được mô tả trong http://nagios.sourceforge.net/docs/3_0/distribution.html .


Chắc chắn là một trường hợp để chạy các máy chủ cục bộ và có một cái nhìn dài về NRPE. Còn về giao thức? Tùy thuộc vào bạn - có lẽ nên được bảo mật, nhưng có ssh, stunnel cũng như VPN thông thường
symcbean

Cảm ơn rất nhiều, một số thông tin tuyệt vời trong bài viết phân tán chắc chắn sẽ có ích.
NmE

1

Nó phụ thuộc vào những gì bạn sẽ theo dõi qua wan. Đối với hầu hết các phần nếu bạn chỉ thực hiện kiểm tra ping, kiểm tra dịch vụ, kiểm tra đĩa, v.v. và thời gian kiểm tra mặc định 5 phút của nagios tôi không thể thấy nó gây ra sự cố cho bạn.

Một lần nữa, tùy thuộc vào những gì bạn đang kiểm tra phụ thuộc vào những gì nó sẽ nói qua. Nếu bạn đang kiểm tra máy chủ windows, bạn chỉ có thể sử dụng truy vấn WMI và thậm chí không cần một tác nhân chạy trên hộp.


1

Điều này là chắc chắn có thể, thông qua một số phương pháp khác nhau.

Nếu "thiết lập phân tán" nằm ngoài câu hỏi, thì bạn cần thực hiện ít nhất một trong các cách sau:

  1. Có tất cả các hộp tại trang web từ xa đẩy kết quả kiểm tra đến Nagios (xem NSCA )
  2. Chọc lỗ tường lửa để Nagios có thể tiếp cận mọi hộp ở mọi trang web từ xa
  3. Chỉ định một hộp duy nhất tại mỗi trang web là một loại "proxy Nagios"

Tôi muốn đề xuất # 3, bởi vì nó yêu cầu chọc lỗ tường lửa ít nhất, và cũng đơn giản hóa cấu hình. Đây là một phiên bản rút gọn của thiết lập phân tán, trong đó nó không yêu cầu một phiên bản Nagios đầy đủ tại mỗi trang web.

Để thực hiện việc này, bạn có thể thiết lập NRPE (hoặc sử dụng check_by_ssh ) và để "proxy" này chạy tất cả các kiểm tra khác đối với các máy chủ khác trên mạng. Điều này có thêm lợi ích của dữ liệu hiệu suất mà bạn nhận được có liên quan đến proxy, do đó nó sẽ không bị ảnh hưởng bởi độ trễ của mạng WAN.

Ngoài ra, sau đó bạn có thể sử dụng các thiết lập cha / con để biến mọi máy chủ tại trang web từ xa trở thành con của proxy, để giảm thông báo dương tính giả. Bạn cũng có thể muốn làm cho tất cả các dịch vụ phụ thuộc vào dịch vụ check_nrpe (hoặc check_ssh) của proxy. Xem tài liệu khả năng tiếp cận mạng để biết thêm.

Cho dù bạn đi theo phương pháp nào, điều rất quan trọng là bạn điều chỉnh thời gian chờ mặc định một cách thích hợp, để tính đến độ trễ khi đi qua các liên kết WAN.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.