Mặc dù đây là một bài viết cũ, trả lời ngay bây giờ vì tôi biết các giá trị ngưỡng check_load là vấn đề đau đầu đối với người mới ..;)
Một cảnh báo, nếu CPU là 70% trong 5 phút, 60% cho 10 phút, 50% cho 15 phút. Một cảnh báo quan trọng, nếu CPU là 90% trong 5 phút, 80% cho 10 phút, 70% cho 15 phút.
*command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7*
Tất cả những phát hiện của tôi về tải CPU:
"Tải" nghĩa là gì: Wikipedia nói:
Tất cả các hệ thống giống như Unix và Unix tạo ra một số liệu gồm ba số "tải trung bình" trong kernel. Người dùng có thể dễ dàng truy vấn kết quả hiện tại từ hệ vỏ Unix bằng cách chạy lệnh thời gian hoạt động:
$ uptime
14:34:03 up 10:43, 4 users, load average: 0.06, 0.11, 0.09
Từ mức trung bình tải đầu ra ở trên: 0.06, 0.11, 0.09
có nghĩa là (trên hệ thống CPU đơn):
- trong phút cuối, CPU đã bị giảm 6%
- trong 5 phút cuối, CPU đã bị giảm 11%
- trong 15 phút cuối, CPU đã bị tải 9%
.
$ uptime
14:34:03 up 10:43, 4 users, load average: 1.73, 0.50, 7.98
Trung bình tải trên của 1.73 0.50 7.98
một hệ thống CPU đơn như:
- trong phút cuối, CPU đã bị quá tải 73% (1 CPU với 1,73 quy trình có thể chạy được, do đó 0,73 quy trình phải chờ đến lượt)
- trong 5 phút cuối, CPU đã bị tải xuống 50% (không có quá trình nào phải chờ đến lượt)
- trong 15 phút cuối, CPU đã bị quá tải 698% (1 CPU với 7,98 quy trình có thể chạy được, do đó 6,98 quy trình phải chờ đến lượt)
Tính toán giá trị ngưỡng Nagios:
Đối với thiết lập tải CPU Nagios, bao gồm cảnh báo và quan trọng:
y = c * p / 100
Ở đâu:
y = nagios value
c = number of cores
p = wanted load procent
cho hệ thống 4 lõi:
time 5 min 10 min 15 min
warning: 90% 70% 50%
critical: 100% 80% 60%
command[check_load]=/usr/local/nagios/libexec/check_load -w 3.6,2.8,2.0 -c 4.0,3.2,2.4
Đối với một hệ thống lõi đơn:
y = p / 100
Ở đâu:
y = nagios value
p = wanted load procent
time 5 min 10 min 15 min
warning: 70% 60% 50%
critical: 90% 80% 70%
command[check_load]=/usr/local/nagios/libexec/check_load -w 0.7,0.6,0.5 -c 0.9,0.8,0.7
Một bài báo trắng tuyệt vời về phân tích tải CPU của Tiến sĩ Gunther http://www.teamquest.com/pdfs/whitepaper/ldavg1.pdf
Trong bài viết trực tuyến này, Tiến sĩ Gunther đã đào sâu vào nhân UNIX để tìm hiểu cách tải trung bình ( Những chuyến đi của LA LA được tính toán và mức độ phù hợp của chúng như là số liệu lập kế hoạch năng lực.
standard
hoặctested
giá trị. Nó phụ thuộc vào khối lượng công việc máy chủ dự kiến của bạn. Nếu bạn mong đợi một tải cao, bạn nên tăng các giá trị. Nếu không, máy chủ của bạn sẽ luôn xuất hiện trong trạng thái quan trọng.