Giải pháp đồ thị Nagios vs Munin / Cacti / Ganglia


9

Tôi đã có một thiết lập máy chủ nagios để theo dõi ~ 30 máy chủ Windows. Tôi muốn thêm một số biểu đồ xu hướng. Tôi đã đọc rằng các plugin đồ thị nagios rất đơn giản và nhiều người sử dụng các công cụ biểu đồ / xu hướng độc lập, riêng biệt.

Các hạn chế của các plugin đồ thị nagios so với các sản phẩm độc lập như ganglia / munin / cacti là gì?

Tôi quan tâm đến các tính năng và ưu điểm cụ thể mà các gói độc lập cung cấp và các plugin đồ họa nagios không có.


Bạn cũng nên xem xét Zabbix ... serverfault.com/q/109595/2039
sebthebert

Hãy thử phiên bản cộng đồng opsview, có trụ sở tại nagios. Bạn có thể cài đặt các hương vị linux khác nhau hoặc tải xuống VM. opsview.com/doads/doad-opsview-community
Matias Dominoni

Đối với hồ sơ: Tôi đã thử dùng nagiosgraph và sau đó bị mắc kẹt với nó. Tôi khá hài lòng với những gì nó cung cấp
sumek

Câu trả lời:


7

cho rằng bạn đã cài đặt nagios, hãy xem xét nagiosgraph hoặc pnp4nagios.

nagiosgraph và pnp4nagios làm một công việc khá hay là vẽ đồ thị dữ liệu hiệu suất của nagios. nagiosgraph có cách tiếp cận dựa trên tham số để cấu hình, pnp4nagios có cách tiếp cận dựa trên mẫu.

  • cả hai đều tự động phát hiện máy chủ / dịch vụ mới bất cứ khi nào cấu hình nagios thay đổi
  • cả hai đều thu phóng đồ thị
  • cả hai đều cung cấp biểu đồ khi bạn di chuyển các máy chủ / dịch vụ cụ thể
  • cả hai đều cung cấp nhiều cách để cắt và xúc xắc dữ liệu của bạn
  • cả phát hiện và vẽ biểu đồ mức độ quan trọng và cảnh báo bạn đã xác định trong nagios
  • cả hai có thể được nhúng trực tiếp vào khung nagios để điều hướng liền mạch, không lộn xộn từ trạng thái hiện tại đến lịch sử và ngược lại

cắt và cắt nhỏ dữ liệu là khá quan trọng, imho. ví dụ: bạn có thể xem tất cả các dịch vụ trên một máy chủ hoặc xem tất cả các máy chủ với một dịch vụ cụ thể hoặc xem các bộ sưu tập biểu đồ tùy ý cho các máy chủ và dịch vụ tùy ý.

cài đặt không phải là nhỏ, nhưng không khó. rất nhiều phụ thuộc vào mức độ bạn muốn tùy chỉnh mọi thứ. ví dụ: nagiosgraph là 'install.pl' hoặc 'rpm -i nagiosgraph.rpm' hoặc 'dpkg -i nagiosgraph.deb'. pnp4nagios là './có hình; làm; cài đặt '.

n2rrd cũng có thể thực hiện một số điều này, nhưng nó không được đánh bóng và đòi hỏi nhiều công việc hơn để cấu hình.

rrdtool có quirks lưu trữ dữ liệu wrt, và bất kỳ hệ thống nào cũng sẽ có vấn đề lấy mẫu. rrdtool thực hiện một số làm mịn dữ liệu theo mặc định, nhưng bạn có thể chụp (và đồ thị) tối đa và / hoặc tối thiểu ngoài mức trung bình nếu cần.

mọi cách tiếp cận dựa trên rrdtool đều chịu sự ổn định của dữ liệu / đồ thị do lược đồ trong mỗi tệp rrd là tĩnh và hầu hết các hệ thống sử dụng tên tệp rrd để xác định dữ liệu. dữ liệu thường không bao giờ bị mất khi tên máy chủ hoặc tên dịch vụ thay đổi; các tập tin rrd vẫn tồn tại trên đĩa. nhưng một số giao diện người dùng cung cấp các cách để xem các tập tin thứ nhất, những cái khác yêu cầu vệ sinh thủ công thông qua dòng lệnh. trên nhiều cài đặt, đây chỉ là một vấn đề khi ban đầu cấu hình hệ thống, nhưng trong môi trường động (ví dụ: giám sát các máy ảo có tuổi thọ chỉ vài tháng), nó có thể trở nên tẻ nhạt.

một lưu ý cuối cùng thực tế có hai phần theo xu hướng: thu thập dữ liệu và hiển thị dữ liệu. nếu bạn đi với một hệ thống đồ họa độc lập thay vì mở rộng cài đặt nagios hiện tại của bạn, thì bạn có thể phải cài đặt các thành phần bổ sung trên các máy tính windows của mình để thu thập dữ liệu.


13

Tôi đồng tình với lynxman. NAGIOS dành cho dữ liệu định tính ngay lập tức (X OK hay không?); munin dành cho dữ liệu định lượng lịch sử (hiện tại X đã đầy đủ như thế nào và năm nay nó đã đầy đủ như thế nào?). Tất cả các cài đặt NAGIOS của tôi, một số trong đó giám sát hàng trăm dịch vụ, được liên kết với các hệ thống munin để thực hiện giám sát định lượng.

Cũng lưu ý rằng munin có các móc cụ thể để cung cấp dữ liệu vào NAGIOS. Nó hiểu khái niệm về ngưỡng CẢNH BÁO và TIÊU CHUẨN, và trong đó thông báo (và chế độ xem trên "bảng lớn" của NAGIOS) được yêu cầu rất dễ dàng để có một biến munin thông báo trạng thái của một dịch vụ NAGIOS duy nhất.

Quy trình công việc thông thường là không ai nhìn vào các biểu đồ munin cho đến khi NAGIOS cảnh báo rằng một ngưỡng đã bị vi phạm, nhưng sau đó các biểu đồ munin trở nên vô giá để tìm hiểu xem liệu có thứ gì đó đang dần tăng lên theo thời gian hay không -lue tăng, hoặc chúng ta có một chu kỳ lên xuống hàng tuần đang tăng dần về biên độ, hoặc những gì.

Như lynxman nói, cách UNIX là "một nhiệm vụ, một công cụ". Tạo một chuỗi công cụ của munin và NAGIOS hoạt động rất tốt đối với tôi để cung cấp giám sát định lượng và định lượng cũng như thông báo. Nó cũng có lợi thế riêng biệt của việc giữ các giao diện sạch: khi bạn nhìn vào Nagios, bạn sẽ thấy một cái nhìn đơn giản như thế nào mọi thứ đang làm việc ngay bây giờ , không có dữ liệu lịch sử cluttering lên quan điểm; Khi bạn nhìn vào munin, bạn sẽ thấy thông tin lịch sử phù hợp với vấn đề đã sẵn sàng cho phân tích của bạn, mà không có lỗi "máy chủ bị hỏng" hoặc "sshd sẽ không nói chuyện với tôi" làm rối tung quan điểm.


3

Các plugin đồ thị Nagios như bạn nói rất hạn chế, chúng cung cấp giao diện rrdtool rất cơ bản và thiết kế UI hơi phản cảm, về cơ bản nó là một bản hack qua nagios, đã cố sử dụng nó chỉ để giải trí nhưng nó đã bị hỏng nhiều lần mà không báo trước.

Tìm kiếm một sản phẩm độc lập (đặc biệt là munin hoặc ganglia) cung cấp cho bạn một loạt các dịch vụ lớn mà nagios không thể thực hiện được, vì câu thần chú unix tốt hơn là chỉ giỏi một điều hơn là cố gắng giỏi nhiều, nagios thật tuyệt vời giám sát và munin / ganglia / cacti là tuyệt vời trong đồ thị.


Vì vậy, những gì bên trong một loạt các dịch vụ lớn mà nagios không thể thực hiện được ? Đây là những gì tôi quan tâm.
sumek

Với nagios, việc mất dữ liệu biểu đồ của bạn rất dễ dàng, plugin cũng rất dễ dàng dừng dữ liệu biểu đồ tại bất kỳ thời điểm nào, nó không cung cấp cho bạn bất kỳ khả năng nào để phóng to vào một thời điểm cụ thể (mà tất cả những người khác làm) không cung cấp cho bạn khả năng thực hiện các biểu đồ tổng hợp phức tạp và đó chỉ dành cho người mới bắt đầu :)
lynxman

Bạn có ý nghĩa gì khi dễ dàng để mất dữ liệu đồ thị của bạn ? Một google nhanh chóng cho thấy rằng tất cả 5 giải pháp được đề cập (ganglia, munin, cacti, pnpgraph, nagiosgraph) sử dụng rrdtool để lưu trữ dữ liệu đồ thị.
sumek

Vâng sumek, điều tôi muốn nói là một lần nữa công cụ vẽ đồ thị trên nagios là một bản hack và bất cứ khi nào có sự không khớp giữa tên tệp rrd và thông tin biểu đồ, nó sẽ bị hỏng, nếu bạn muốn thử, hãy chịu đựng nỗi đau như tôi đã làm và sau đó chuyển sang một giải pháp thực sự như munin :)
lynxman

2

Tại Stack Overflow, chúng tôi sử dụng n2rrd , một plugin Nagios để vẽ đồ thị dữ liệu hiệu suất. Ở một mức độ nào đó, tôi sẽ đồng ý với lynxman rằng nó có một cảm giác rất lớn.

Tuy nhiên:

  • Với n2rrd, bạn có thể yêu cầu Cacti thực hiện việc vẽ đồ thị dựa trên dữ liệu thay vì rrd2graph.cgi đi kèm với n2rrd
  • n2rrd với rrd2graph.cgi không hỗ trợ thu phóng
  • Theo như các biểu đồ tổng hợp phức tạp - về cơ bản bạn thao tác các biểu đồ thứ r bằng tay và có thể làm bất cứ điều gì bạn muốn với chúng.

Các biểu đồ thứ r được lưu trữ theo tên máy chủ, vì vậy nếu bạn thay đổi tên của thứ gì đó bạn sắp xếp dữ liệu ... Bạn luôn có thể đổi tên các tệp là liên kết tượng trưng cho chúng và bạn sẽ không mất dữ liệu.

Tôi có một số ví dụ về các biểu đồ này tại một số Lời khuyên gần đây của tôi về bài đăng Blog Lỗi Máy chủ Đồ thị RRD tốt hơn . Ngoài ra, trang n2rrd bao gồm cả bản demo cacti cũng như rrd2graph.

Tôi nghĩ điểm mấu chốt là việc đi theo con đường Nagios có thể thiếu một hoặc hai tính năng nhưng khá hoàn chỉnh nếu bạn không ngại làm bẩn tay với các chi tiết tự viết mẫu rrd *. Nó có thể sẽ mất nhiều thời gian của bạn hơn nhưng nó sẽ khuyến khích phát triển thêm chuyên môn trong rrd.


1
* [lỗi chú thích không được ước tính]: bạn định thêm gì vào đó, kyle; tìm hiểu tâm trí cần biết!
MadHatter

0

Tôi yêu cầu dữ liệu chính xác và hiển thị dữ liệu của rrd không chính xác - nó được chuẩn hóa! Đối với hầu hết người dùng, điều này là tốt vì họ không sử dụng dữ liệu rất chính xác để bắt đầu. Họ đang sử dụng dữ liệu có tốc độ mẫu thường ở một phút trở lên và điều đó sẽ không cung cấp cho bạn một mô tả rất chính xác về những gì đang xảy ra. Điều này cũng có nghĩa là nếu bạn có sự tăng đột biến trong dữ liệu của mình ở đâu đó thì bạn có thể không bao giờ nhìn thấy nó.

Hãy xem xét điều này - giả sử mạng Gb của bạn đang hoạt động với tốc độ khoảng 10MB / giây và đột nhiên có tốc độ tăng 100 MB / giây trong vài phút. Cũng lưu ý nếu nó chỉ tăng 30 giây, bạn thậm chí có thể không nhìn thấy nó ở tốc độ lấy mẫu trong vài phút. Nếu bạn xem dữ liệu trong ngày, 'spike' đó chỉ có thể hiển thị là 15MB / giây, mặc dù giá trị thực tế cũng phụ thuộc vào một số yếu tố khác. Cũng có khả năng rất cao bạn sẽ cho rằng mạng của mình hạnh phúc khi không!

Điều thậm chí còn khó chịu hơn đối với tôi là dữ liệu được chuẩn hóa theo chiều rộng vật lý của biểu đồ và phạm vi của trục x. Điều này có nghĩa là sự tăng đột biến mà tôi đã đề cập mà bạn không thấy? Nếu bạn phóng to nó sẽ xuất hiện một cách kỳ diệu! Tôi sẽ gắn bó với gnuplot - các biểu đồ có thể không đẹp bằng nhưng chúng rất chắc chắn và gnuplot không bao giờ sửa đổi dữ liệu trước khi hiển thị nó.

-dấu


0

Tôi thấy việc sử dụng pnp4nagios hoạt động khá tốt cho đồ thị. Nó cũng hỗ trợ zoom. Nó không phải là dễ thực hiện nhất, nhưng không có gì với nagios bao giờ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.