Tôi đang cố gắng hiểu một số dữ liệu được lấy từ SAR. Tôi có ba câu hỏi chính về điều này. Cuối cùng, tôi muốn xác định có bao nhiêu CPU không hoạt động ở mỗi khoảng thời gian lấy mẫu trên một cụm máy chủ.
- Nhiều CPU không hiển thị trong mỗi mục. Đây có phải là mong đợi và chính xác điều đó có nghĩa là gì? Có liên quan đến # 2?
- Có những dòng không được sử dụng (CPU = U). Các tài liệu cho biết "U chỉ ra khả năng không được sử dụng trên toàn hệ thống". Tôi thực sự không thể tìm thấy một định nghĩa chính xác về "dung lượng chưa sử dụng trên toàn hệ thống" hoặc bất kỳ định nghĩa nào. Tôi không chắc làm thế nào để diễn giải một dòng cho biết một cái gì đó như "khả năng không sử dụng là 70% nhàn rỗi."
- Cuối cùng, tôi không chắc về cách tính
-
hoặcall
dòng. Tôi sẽ nghĩ rằng đó là trung bình của tất cả các CPU nhưng khi tôi làm toán trên tất cả các CPU, tôi nhận được một câu trả lời rất khác so với những gì trên dòng đó. Bất cứ ai có thể cho tôi biết chính xác những gì đi vào tính toán đó? Nhìn kỹ vào câu hỏi liên quan này về SAR, có vẻ nhưsystem-wide
tỷ lệ phần trăm nhàn rỗi là tổng sản phẩm của mỗi phần trăm nhàn rỗi của CPU và giá trị 'vật lý'. Thật không may, tôi không cóphysc
hoặc entc% (giả sử có một) vì vậy tôi không thể xác minh điều này với dữ liệu của riêng tôi. Nếu điều đó đúng, điều đó có nghĩa là tôi cần cácphysc
giá trị để thực sự hiểu phần trăm nhàn rỗi?
Dưới đây là một số ví dụ về những gì tôi đang thấy. Đây là tất cả từ cùng một ngày.
CPU | Idle CPU | Idle CPU | Idle
---------- ---------- ----------
0 | 8 0 | 15 0 | 17
1 | 25 1 | 94 1 | 32
2 | 79 2 | 100 2 | 97
3 | 62 3 | 99 3 | 71
4 | 5 4 | 13 4 | 5
5 | 7 5 | 13 5 | 23
6 | 6 6 | 99 6 | 71
7 | 7 7 | 44 7 | 98
8 | 11 8 | 12 8 | 48
9 | 17 12 | 0 12 | 38
10 | 33 16 | 12 16 | 37
11 | 64 20 | 3 20 | 42
12 | 6 U | 95 U | 97
13 | 6 - | 15 - | 85
14 | 6
15 | 6
16 | 12
17 | 15
18 | 62
19 | 69
20 | 7
21 | 7
22 | 6
23 | 7
U | 80
- | 15
case 1: avg(24): 22
case 2: avg(12): 42
case 3: avg(12): 48
Dữ liệu này được tạo bởi một tập lệnh chạy: sar -P ALL 1 1
Sau đó, nó chạy một lệnh awk. Tôi không tốt với awk nhưng đây rõ ràng là những phần quan trọng:
Bộ lọc: /System|AIX|^$|%/ {next}
Phân tích: {k=0;if(NR==7) k=1} {sub("^-", "all", $1); cpu=$(1+k); user=$(2+k); sys=$(3+k); io=$(4+k); idle=$(5+k)}
Điều này có vẻ đúng dựa trên những gì tôi hiểu về awk và những gì tôi thấy từ các ví dụ về đầu ra.
Nếu tôi giả sử rằng các giá trị bị thiếu đều bằng 0 đối với trường hợp 2, thì trung bình là 21 có vẻ hơi phù hợp với trường hợp 1. Tuy nhiên, nếu tôi đưa ra giả định đó cho trường hợp 3, tôi nhận được 24% tỷ lệ cược hoàn toàn với 85% giá trị phần trăm được cung cấp bởi sar cho tổng thể CPU nhàn rỗi.
Dưới đây là biểu đồ chụp cả ngày (cứ sau 30 giây):
Khi có rất ít thời gian nhàn rỗi 'toàn hệ thống', mối tương quan giữa không hoạt động của CPU trung bình và không hoạt động 'toàn hệ thống' là gần như hoàn hảo. Nhưng khi thời gian nhàn rỗi của toàn hệ thống tăng lên, mối tương quan trở nên yếu hơn nhiều. Làm việc dựa trên giả định rằng đây là những cỗ máy xác định, điều đó cho tôi biết rằng dữ liệu tôi có không đưa ra bức tranh đầy đủ. Nhưng tôi quan tâm đến mức nào?
Tôi không hiểu đầy đủ lý do tại sao một số CPU không được báo cáo tại mỗi điểm nhưng những CPU bị thiếu không được phân phối đều như đã thấy trong các ví dụ ở trên. Ngoài ra, từ việc đọc cuốn sách đỏ này , tôi cho rằng đây phải là những CPU hợp lý và nếu không có physc
số, tôi nghĩ tôi không thể làm được gì nhiều với những giá trị này. Tôi đã cố gắng sử dụng U
giá trị trong các phương trình khác nhau nhưng tôi không tìm thấy bất cứ điều gì hợp lý. Tôi thậm chí còn không rõ ràng rằng phần trăm nhàn rỗi tổng thể có thể được lấy theo mệnh giá.
LƯU Ý : Có gì đó không đúng với việc thu thập dữ liệu này từ sar là câu trả lời hoàn toàn hợp lệ cho # 1, nếu đó là trường hợp nó luôn luôn phải trả về.
sar -P ALL 1 1
và sau đó sử dụng awk để phá vỡ số cpu và sau đó là tỷ lệ phần trăm người dùng, hệ thống, IO-Wait và idle. Tôi sẽ thêm thông tin vào câu trả lời của bạn.
sar -P ALL
trực tiếp, thay vì đầu ra của tập lệnh này không? Đó là một kịch bản không chuẩn và không ai có thể nói cho bạn biết nó làm gì mà không nhìn thấy nó.
sar -P ALL
đầu ra tiêu chuẩn .