Tải cao trên máy chủ nagios - Có bao nhiêu dịch vụ kiểm tra cho máy chủ nagios là quá nhiều?


9

Tôi có một máy chủ nagios chạy Ubuntu với Bộ xử lý Intel 2.0 GHz, mảng RAID10 và RAM 400 MB. Nó giám sát tổng cộng 42 dịch vụ trên 8 máy chủ, hầu hết trong số đó được kiểm tra bằng cách sử dụng plugin check_http thậm chí 5 phút, một số mỗi phút. Gần đây, tải trên máy chủ nagios đã ở mức trên 4, thường cao tới 6. Máy chủ cũng chạy xương rồng, thu thập số liệu thống kê mỗi phút cho 6 máy chủ.

Tôi tự hỏi, có bao nhiêu dịch vụ nên phần cứng như thế này có thể xử lý? Là tải quá cao bởi vì tôi đang đẩy các giới hạn của phần cứng, hoặc phần cứng này có thể xử lý 42 kiểm tra dịch vụ cộng với xương rồng không? Nếu phần cứng không đủ, tôi nên tìm cách thêm RAM, nhiều lõi hơn hay lõi nhanh hơn? Những kiểm tra phần cứng / dịch vụ nào người khác đang chạy?


Hiện tại việc sử dụng ram trông như thế nào trên máy chủ? Ngoài ra việc sử dụng cpu trông như thế nào? Nếu đó là những gì quá trình cao đang gắn kết nó?
3dinfluence

Bạn đã giải quyết vấn đề chưa ? Chúng tôi đang gặp vấn đề tương tự. Tải avg là 12 ..
John

Câu trả lời:


7

Bạn cần tìm ra nút thắt cổ chai của bạn ở đâu ...

Tôi chạy một màn hình nagios kiểm tra hơn 400 máy chủ với các kiểm tra http, ping và ssh. (cùng với rất nhiều kiểm tra thụ động và nscd khác)

Đây là trên máy chủ 2xQuadCore với 4 đĩa SAS trong RAID10.

Tôi nghi ngờ bạn đang có sự tranh chấp IO, vì viết cho nhiều rrd là rất không hiệu quả.

Bạn cần tìm ra quá trình nào đang chiếm dụng tài nguyên của bạn. (xương rồng, nagios hoặc cái gì khác)

Để kiểm tra IO, tôi thích iotop. Cài đặt iotop (gói 9.04 hoạt động trên 8.04)

Nhưng nếu không, đầu trang cũng sẽ giúp bạn tìm thấy lợn tải của bạn.

Cacti mỗi phút một lần là khá tích cực. (Tôi chạy của tôi cách nhau 5m)

Một cách tiếp cận mà tôi đã nghe nói về tranh chấp viết rrd là đưa các cửa hàng rrd của bạn lên một ramdisk / tmpfs. (hãy chắc chắn để rsync rằng mọi lúc và sau đó để lưu trữ liên tục)

Chúc may mắn.


Cảm ơn. Tôi sẽ xem xét nó. Nó có thể là xương rồng tạo ra tải, và tôi sẽ xem liệu có cách nào để di chuyển các rrd sang tmpfs không. Hoặc chỉ cần thêm RAM để máy chủ có thể đệm các rrd. Tôi sợ nếu tôi chạy xương rồng cứ sau 5 phút thì có thể có những đợt tăng tải chỉ kéo dài 1 hoặc 2 phút mà tôi hoàn toàn sẽ bỏ lỡ ...
Josh

6

Trừ khi xương rồng tạo ra hầu hết tải thì bạn sẽ có thể chạy nhiều kiểm tra hơn so với phần cứng của bạn.

Tôi đang chạy nagios trên máy ảo FreeBSD chạy trên Microsoft Virtual Server trên PC cũ chậm chó (Pentium 3 1GHz với đĩa PATA chậm). Máy ảo chỉ có 128 MB RAM và hiệu năng rất tệ.

Tuy nhiên, trung bình tải khoảng 0,2, chạy 158 kiểm tra trên 42 máy chủ.


Cảm ơn. Tôi ước tôi có thể chấp nhận cả hai câu trả lời! Của bạn rất hữu ích, nó cho tôi biết rằng xương rồng có lẽ là thủ phạm.
Josh

2

Trên một PIII cũ với 256 MB RAM, tôi đang tích cực theo dõi khoảng 230 dịch vụ khác nhau. Máy tương tự cũng đang chạy MRTG và HylaFAX cho tất cả các bản fax đến của chúng tôi và hoạt động khá thoải mái.


Thông tin rất hữu ích. Điều này cho tôi thấy rằng xương rồng có lẽ là thủ phạm, không phải nagios. Cảm ơn!
Josh

1

Bạn sẽ có thể chạy một số lượng lớn các kiểm tra nagios với phần cứng đó. Chúng tôi chạy một thiết lập tương tự với khoảng 70 kiểm tra và Nagiosgraph - sự khác biệt chính là thêm RAM (nó rẻ, vì vậy tôi đã nâng hộp lên 2Gb).

Hãy thử chạy top hoặc ps -aux để xem CPU có bị quá tải không, nhưng tôi nghi ngờ điều đó. Bạn cũng có thể muốn kiểm tra các tài liệu song song hóa nagios để xem liệu cài đặt của bạn đang cố chạy quá nhiều kiểm tra cùng một lúc chứ không phải tuần tự hóa chúng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.