Các plugin Nagios hữu ích / có giá trị nhất của bạn là gì? [đóng cửa]


33

Chúng tôi đang mở rộng thiết lập Nagios 3 và thường xuyên bắt gặp các plugin NRPE hoặc Nagios chung mới để kiểm tra cơ sở hạ tầng hiện tại của chúng tôi. Mặc dù vậy, đây là những thứ nhỏ giọt và buồn tẻ - sẽ rất hữu ích khi có được một bản tóm tắt các plugin mà người dùng Nagios có giá trị nhất.

Vui lòng liệt kê một plugin cho mỗi bài đăng, tốt nhất là với một mô tả ngắn về lý do tại sao bạn thích nó và một liên kết đến trang webExExExchange hoặc nhà phát triển plugin. Bằng cách này, dân gian có thể bỏ phiếu cho các plugin đã được liệt kê và chúng ta có thể thấy chúng theo thứ tự ưu tiên.

Sẽ tốt hơn nếu không liệt kê các plugin mà người khác đã đề cập, vì lý do tương tự. Nếu bạn có thêm thông tin về plugin mà người khác đã liệt kê, vui lòng để lại nhận xét cho câu trả lời của họ.

Cảm ơn!

Câu trả lời:


8

Về tính linh hoạt, bạn không thể đánh bại plugin snmp. Nó đứng sau gần như mọi kiểm tra tôi chạy và nếu không, thì kết nối TCP là.


Kiểm tra snmp có vẻ khá tốt cho mục yêu thích ở giai đoạn này Matt (và những người khác :) - bạn có bất kỳ kỹ thuật đặc biệt nào mà bạn sử dụng với nó không? Thịt bò chính của tôi với net-snmpd tại thời điểm này là sự phức tạp của chức năng mở rộng 'mới' hơn là thực thi - liệu check_snmpd có xử lý tốt điều này không?
Mike Pountney

7

Các plugin hữu ích nhất của chúng tôi là các plugin kiểm tra chức năng ứng dụng cao hơn của chúng tôi. Ví dụ: chúng tôi có các bài kiểm tra cố gắng đăng nhập vào trang web và các bài kiểm tra cố gắng gửi email và kiểm tra kiểm tra hộp thư pop3 để đảm bảo rằng nó đã đến. Nếu bất kỳ điều nào trong số đó bị hỏng, thì chúng ta có thể sử dụng kiểm tra cấp thấp hơn để xem có gì sai. Pop3 có chết không? MTA, MDA? Các máy chủ cơ sở dữ liệu? kho dữ liệu?


Wotcha Dave;) Bạn có bất cứ lời khuyên nào về cách bạn kết nối kiểm tra cấp cao hơn và cấp thấp hơn không? Ví dụ: làm thế nào để bạn tạo ra sự phụ thuộc giữa việc gửi email và kiểm tra hộp pop3 để xem nó ở đó? Có thể làm điều này hoàn toàn thông qua Nagios, hoặc bạn đang sử dụng logic của riêng bạn?
Mike Pountney

Bạn có thực sự thức dậy lúc 4 giờ sáng? :) Nagios có các phụ thuộc dịch vụ, vì vậy bạn có thể thực hiện kiểm tra email của mình tùy thuộc vào kiểm tra smtp, MDA và POP3, nhưng điều này chỉ có nghĩa là kiểm tra email không cảnh báo nếu bất kỳ cấp dưới nào thực hiện. Thi sẽ khó hơn rất nhiều nếu bạn có một cụm máy chủ cung cấp dịch vụ vì không có cách nào để nagios nói "đừng cảnh báo chúng tôi về dịch vụ này nếu tất cả các dịch vụ này đã chết". Thông thường chúng ta chỉ dựa vào việc biết làm thế nào hệ thống khớp với nhau để biết vấn đề nằm ở đâu.
David Pashley

7

Thành thật mà nói, người làm nhiều nhất đối với tôi là người già check_disk. Không có gì khiến tôi cảm thấy khá đặc biệt, theo cách "ngừng ăn miếng dán" đó, vì có một máy chủ đang hoạt động tốt vào ngày hôm qua, chạy xung quanh như điên và sau đó phát hiện ra vì tôi để đĩa đầy. Không bao giờ phải làm điều đó một lần nữa trong cuộc sống của tôi là giá trị rất nhiều với tôi.

(Và đừng quên kiểm tra các nút, quá, trẻ em xem ở nhà.)


7

WebInject rất hữu ích để theo dõi các trang web nếu bạn muốn vượt ra ngoài chức năng check_http; nó có thể xử lý các trang đăng nhập và thực hiện nhiều bước trong một lần kiểm tra Nagios.


4

Tôi thấy check_nfsmount hữu ích trên nhiều máy chủ của tôi.

Chỉnh sửa: Tôi cũng sẽ bỏ phiếu lên check_snmp nếu tôi có đại diện để làm điều đó. Nó được sử dụng trên tất cả các máy chủ của tôi, cộng với logic đằng sau check_hpjd mà tôi đã chạy trên tất cả các Máy in HP của mình.


4

Cái hữu ích nhất của tôi là cái mà tôi đã tự viết để kiểm tra chứng chỉ SSL trên máy chủ web của chúng tôi để tôi có thể theo dõi hết hạn.


Nó được đăng ở bất cứ đâu?
RainyRat

4
kiểm tra_http -H www.verisign.com -C 14
wittwerch

4

PNP (pnp4nagios.org) - tạo các biểu đồ kiểu RRD cho bất kỳ kiểm tra Nagios nào cho ra kết quả hoàn hảo. dữ liệu. Cực kỳ hữu ích, đặc biệt là khi cố gắng thuyết phục các nhà phát triển rằng dịch vụ mới được cài đặt thực sự là nguyên nhân của tất cả các đột biến CPU đó ...


3

check_nt (nói chuyện với NSClient hoặc một cái gì đó tương tự về chủ đề này) cho phép bạn thẩm vấn WMI trên hộp Windows - nếu có bộ đếm hiệu suất cho nó, bây giờ bạn có thể theo dõi nó với Nagios.


Và bạn có thể theo dõi tất cả các dịch vụ của mình đang chạy, ví dụ kiểm tra máy chủ trao đổi hoặc máy chủ sql đang chạy
Simon Foster

2

Đây là một chút của một phích cắm không biết xấu hổ, nhưng nếu bạn đang theo dõi các máy Windows sử dụng NRPE, NagiosPluginsNT dường như hoạt động khá tốt. ;-)


2

Tôi đồng ý rằng check_snmp là một plugin cực kỳ giá trị; nó có thể được sử dụng cho hầu hết mọi mục đích và mọi thứ hiện lên trong SNMP nói chung. SNMP có sẵn trên các hệ thống đa dạng như HP-UX, Tru64 và OpenVMS mà không cần cài đặt bổ sung.

Một plugin khác (không hoàn toàn là một) rất hữu ích là NagiosGograph; Tôi có kinh nghiệm của mình trong một bài viết giải thích thêm, nhưng cũng để người khác có thể sử dụng nó mà không gặp bất kỳ khó khăn nào mà tôi gặp phải.

Một cuối cùng: NSCA. Bạn có thể viết tập lệnh Perl hoặc Ruby hoặc ksh và đưa đầu ra vào NSCA.

Giữa tính linh hoạt của NSCA và SNMP kết hợp với báo cáo của NagiosGograph, điều này sẽ mở rộng sự giám sát của bạn rất tốt.


2

Tôi thích check_http để kiểm tra các trang web của tôi vẫn hoạt động, tôi đã mở rộng nó để kiểm tra xem có thể tìm thấy văn bản nào đó trên đó sau một lần công ty lưu trữ của tôi quyết định phục vụ các trang trống và nagios của tôi kiểm tra tất cả khi máy chủ vẫn đang chạy.


2

Hữu ích nhất đối với tôi là một cái tôi đã viết cho nhu cầu của mình: nagios-check-website

Nó tải xuống toàn bộ trang với js / css / hình ảnh, với nhiều luồng và gzip (tiết kiệm rất nhiều băng thông), giống như các trình điều hướng thực sự.


+1 Thật vậy, plugin đó thật tuyệt vời. Sử dụng nó cho ứng dụng. 4 tháng nay.
Henk

1

Thứ nhất là NagiosWSC Nó cho phép bạn làm agentless giám sát của máy chủ Windows trên WMI


không có tác dụng, nhưng với một điểm thất bại lớn, ugh.
Toto

1

Một kiểm tra độ trễ thực tế để kéo các trang web lên và quét nó để tìm thẻ ẩn 'status: ok'. Nó đã gặp sự cố với bộ đệm mực của chúng tôi và sự cố về ngôn ngữ chỉ xảy ra một lần vài đêm vào lúc 3 giờ sáng khi ai đó truy cập trang web bằng trình duyệt yêu cầu phiên bản quốc tế hóa bằng tiếng Thổ Nhĩ Kỳ.

Nghiêm túc, thiết lập mọi loại giám sát mà bạn có thể có thể. Các lỗi và lỗi kỳ lạ mà bạn có thể bắt gặp trong một môi trường phức tạp với sự giám sát tốt thật đáng kinh ngạc. Ngoài ra, đăng nhập dữ liệu hiệu suất của bạn vào cơ sở dữ liệu thứ r và hiển thị nó trong Cacti.


1

Một trong những plugin quan trọng nhất là plugin tôi đã tự viết: check_rdiff_backup. Tôi thực hiện sao lưu ở nước ngoài và Nagios cho tôi biết nếu và khi có chuyện gì xảy ra với họ.

Nếu bạn đang tìm kiếm plugin sao lưu dự phòng, có một plugin mà bạn có thể tìm thấy trên Google.


1
Bạn có biết một cho rsnapshot?
Rory

1

check_curl đối với tôi đã là một ơn trời. Thực sự đã tạo ra sự khác biệt cho tính linh hoạt khi thực hiện kiểm tra trang web và cũng thấy nó dễ dàng hơn nhiều so với webinject, với hầu hết tất cả các chức năng tương tự mà tôi cần


1

Không hoàn toàn là một plugin, nhưng việc sử dụng twurl ( https://github.com/marcel/twurl ) để hoạt động như một phương tiện để tắt cảnh báo là một ưu đãi tuyệt đối. Không cần thông báo SMS và chỉ cần đáp ứng tất cả các vòng.

Chi tiết về cách nó được thực hiện: Cảnh báo Nagios sử dụng twitter (với twurl) không bắn - xin lỗi vì quảng cáo tự xấu hổ;)

Những thứ khác...

Check_diskio ( https://trac.id.ethz.ch/projects/nagios_plugins/wiki/check_diskio ) cực kỳ hữu ích khi kết hợp với tải CPU tiêu chuẩn và kiểm tra số quy trình để xác định khi nào / nếu IO bị ràng buộc và theo cách nào . Sử dụng nagiosgraph ( http://exchange.nagios.org/directory/Addons/Graphing-and-Treinating/nagiosgraph/details ) làm cho nó thậm chí còn dễ dàng hơn.


1

Chà, những cái đơn giản, đơn giản và mặc định - check_disk, check_load, check_http là đủ hoàn hảo cho hầu hết các trường hợp (chủ yếu chúng tôi muốn biết liệu máy chủ, trang web có hoạt động hay không, phải không)

và ngoài check_disk và check_swap, có một check_memory http://exchange.nagios.org/directory/Plugins/Unc Classified /Oidating-Systems / Linux / check_memory / default sẽ cung cấp cho bộ nhớ ...




0

Đây là một kiểu gian lận, bởi vì tôi đã phát triển rất nhiều về nó và nó thực sự kiểm tra nhiều thứ khác nhau cùng một lúc, nhưng 'plugin' nagios hữu ích nhất đối với tôi là Resmon . Nó là một tác nhân bạn chạy trên chính máy chủ và nagios kết nối qua http để thực hiện kiểm tra. Tôi đoán nó tương tự như những gì nrpe làm, nhưng với một số quyết định thiết kế khác nhau.


0

Tôi đã sử dụng hai plugin .. một là cung cấp nguồn cấp dữ liệu XML cho các cảnh báo và một là để gửi thông báo qua twitter. Cả hai đều hữu ích (ngoài các plugin thông thường). nếu bạn tính NRPE như một plugin, thì bạn cũng nên thêm nó.


0

check_apt thực sự rất hay và nhắc nhở tôi về việc cập nhật các máy chủ Debian của mình.


0

Gần đây tôi bắt đầu sử dụng plugin check_multi , sử dụng NRPE được vá / nâng cao cho đầu ra lớn (vì HTML và thông tin hiệu suất).
Nó gần như là "một plugin để thống trị tất cả"! ;-)

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.