Ai đó có thể giải thích các trường hợp sử dụng trên mạng cho các biểu đồ munin mặc định không?


9

Khi cài đặt munin, nó kích hoạt một bộ plugin mặc định (ít nhất là trên Ubuntu). Ngoài ra, bạn chỉ cần chạy munin-node-configuređể tìm ra plugin nào được hỗ trợ trên hệ thống của mình. Hầu hết các plugin này vẽ dữ liệu chuyển tiếp thẳng. Câu hỏi của tôi là không để giải thích bản chất của dữ liệu (cũng ... có lẽ đối với một số) nhưng những gì nó là bạn tìm kiếm trong các đồ thị?

Thật dễ dàng để cài đặt munin và xem các biểu đồ ưa thích. Nhưng có các biểu đồ và không thể "đọc" chúng làm cho chúng hoàn toàn vô dụng.

Tôi sẽ liệt kê các plugin tiêu chuẩn được bật theo mặc định trên hệ thống của tôi. Vì vậy, nó sẽ là một danh sách dài. Để đầy đủ, tôi cũng sẽ liệt kê các plugin mà tôi nghĩ sẽ hiểu và đưa ra một lời giải thích ngắn gọn về những gì tôi nghĩ nó được sử dụng cho. Xin vui lòng sửa nếu tôi sai với bất kỳ trong số họ.

Vì vậy, hãy để tôi chia câu hỏi này thành ba phần:

  • Plugin nơi tôi thậm chí không hiểu dữ liệu
  • Plugin nơi tôi hiểu dữ liệu nhưng không biết tôi nên tìm gì
  • Các plugin mà tôi nghĩ sẽ hiểu

Plugin nơi tôi thậm chí không hiểu dữ liệu

Chúng có thể chứa các câu hỏi không nhất thiết chỉ nhắm vào munin. Không hiểu dữ liệu thường có nghĩa là một lỗ hổng kiến ​​thức cơ bản về hệ điều hành / phần cứng ....;) Hãy thoải mái trả lời bằng câu trả lời "giyf".

Đây là những plugin mà tôi chỉ có thể đoán những gì đang diễn ra ... Tôi hầu như không muốn nhìn vào những "đoán" này ...

  • IOs trên mỗi thiết bị (IOs / giây)
    IO là gì. Tôi biết nó là viết tắt của đầu vào / đầu ra. Nhưng đó là tất cả.
  • Độ trễ ổ đĩa trên mỗi thiết bị (Chờ IO trung bình)
    Không phải là đầu mối "Chờ IO" là ...
  • Thời gian phục vụ của IO
    Đây là một mớ hỗn độn rất lớn và gần như không thể nhìn thấy thứ gì đó trong biểu đồ.

Plugin nơi tôi hiểu dữ liệu nhưng không biết tôi nên tìm gì

  • IOStat (khối / giây đọc / ghi)
    Tôi giả sử, điều cần chú ý ở đây là gai? Điều đó có nghĩa là thiết bị đang được sử dụng nhiều?
  • Entropy có sẵn (byte)
    Tôi cho rằng điều này quan trọng đối với việc tạo số ngẫu nhiên? Tại sao tôi lại vẽ đồ thị này? Cho đến nay giá trị luôn luôn gần như không đổi.
  • VMStat (đang chạy / I / O quá trình ngủ)
    Sự khác biệt giữa biểu đồ này và biểu đồ "quy trình" là gì? Cả hai đều hiển thị các quy trình chạy / ngủ, trong khi biểu đồ "Quy trình" dường như có nhiều chi tiết hơn.
  • Thông lượng đĩa trên mỗi thiết bị (byte / giây đọc / ghi)
    Sự khác biệt giữa biểu đồ này và biểu đồ "IOStat" là gì?
  • Sử dụng bảng inode
    Tôi nên tìm gì trong biểu đồ này?

Các plugin mà tôi nghĩ sẽ hiểu

Tôi sẽ đoán một số điều ở đây ... sửa tôi nếu tôi sai.

  • Sử dụng đĩa theo phần trăm (phần trăm) Dung
    lượng đĩa được sử dụng / còn lại. Vì điều này đang đến gần 100%, bạn nên xem xét việc dọn dẹp hoặc mở rộng phân vùng. Điều này là vô cùng quan trọng đối với phân vùng gốc.
  • Tường lửa thông lượng (gói / giây)
    Số lượng gói đi qua tường lửa. Nếu điều này xảy ra trong một khoảng thời gian dài hơn, đó có thể là dấu hiệu của một cuộc tấn công DOS (hoặc chúng tôi chỉ đơn giản là nhận được một tệp lớn). Nó cũng có thể cung cấp cho bạn một ý tưởng về hiệu suất tường lửa của bạn. Nếu nó chững lại và bạn cần thêm "sức mạnh", bạn nên xem xét cân bằng tải. Nếu nó chững lại và thấy mối tương quan với tải CPU của bạn, điều đó cũng có nghĩa là phần cứng của bạn không đủ nhanh. Mối tương quan với việc sử dụng đĩa có thể chỉ ra các mục tiêu LOG ​​quá mức trong cấu hình FW của bạn.
  • lỗi eth0 (gói vào / ra)
    Lỗi mạng. Nếu giá trị này tăng lên, đó có thể là dấu hiệu của phần cứng bị lỗi.
  • lưu lượng eth0 (bit / giây vào / ra)
    Lưu lượng mạng thô. Điều này sẽ tương quan với thông lượng tường lửa.
  • số lượng luồng
    Một giá trị ngày càng tăng có thể chỉ ra một quá trình không đóng đúng luồng. Điều tra!
  • quy trình
    Phân tích các quá trình hoạt động (bao gồm cả ngủ). Một sự tăng vọt nhanh chóng ở đây có thể chỉ ra một quả bom ngã ba. Giá trị chậm, nhưng ngày càng tăng có thể chỉ ra một ứng dụng sinh ra các quy trình con nhưng không đóng chúng đúng cách. Điều tra sử dụng ps faux.
  • ưu tiên quá trình
    Điều này cho thấy sự phân phối các ưu tiên của quá trình. Chỉ có các quy trình ưu tiên cao không được sử dụng nhiều. Xem xét giảm ưu tiên một số.
  • sử dụng cpu
    Khá đơn giản. Nếu điều này xảy ra, bạn có thể có một cuộc tấn công đang diễn ra hoặc một quá trình đang làm hỏng CPU. Idf nó đang tăng chậm và tiếp cận tối đa trong các hoạt động bình thường, bạn nên xem xét nâng cấp phần cứng của bạn (hoặc cân bằng tải).
  • sử dụng bảng tệp
    Số lượng tệp tích cực mở. Nếu điều này đạt đến mức tối đa, bạn có thể có một quá trình mở, nhưng không phát hành tập tin đúng cách.
  • tải trung bình
    Hiển thị một giá trị tóm tắt cho tải hệ thống. Nên tương quan với việc sử dụng CPU. Việc tăng giá trị có thể đến từ một số nguồn. Tìm mối tương quan với các đồ thị khác.
  • sử dụng bộ nhớ
    Một đại diện đồ họa của bộ nhớ của bạn. Miễn là bạn có nhiều bộ đệm + bộ đệm + không sử dụng, bạn vẫn ổn.
  • trao đổi vào / ra
    Hiển thị hoạt động trên phân vùng trao đổi của bạn. Điều này phải luôn là 0. Nếu bạn thấy hoạt động trên này, bạn nên thêm bộ nhớ vào máy của mình!

Câu hỏi tuyệt vời, dễ dàng áp dụng cho Cacti và các ứng dụng đồ họa khác. Các biểu đồ thường trông rất tuyệt, nhưng thật khó để tìm ra ý nghĩa của chúng, và hơn nữa những gì cần chú ý hơn nữa trông như thế nào.
dunxd

2
Đối với "Tại sao tôi biểu đồ này? Cho đến nay giá trị luôn luôn gần như không đổi." một phần, hãy nhớ rằng hầu hết thông tin thường chỉ có giá trị trong trường hợp có vấn đề.
Steve Schnepp

Câu trả lời:


11

IOs trên mỗi thiết bị (IOs / giây)

Với ổ cứng truyền thống, đây là một con số rất quan trọng. Thao tác I / O là thao tác đọc hoặc ghi vào đĩa. Với các trục quay, bạn có thể di chuyển từ hàng chục đến 200 IOPS mỗi giây, tùy thuộc vào tốc độ đĩa và kiểu sử dụng của nó.

Đây không phải là tất cả: các hệ điều hành hiện đại có bộ lập lịch I / O cố gắng hợp nhất một số yêu cầu I / O làm một và làm cho mọi thứ nhanh hơn theo cách đó. Ngoài ra, các bộ điều khiển RAID cũng như vậy thực hiện sắp xếp lại một số yêu cầu I / O thông minh.

Độ trễ đĩa trên mỗi thiết bị (Chờ IO trung bình)

Mất bao lâu để thực hiện yêu cầu I / O đến một đĩa riêng lẻ để thực sự nhận dữ liệu từ đó. Nếu điều này dao động trong vài mili giây, bạn vẫn ổn, nếu đó là hàng chục ms, thì bạn bắt đầu thấy hệ thống con của mình đổ mồ hôi, nếu hàng trăm ms nữa, bạn sẽ gặp rắc rối lớn, hoặc ít nhất là có rất, rất hệ thống chậm.

Thời gian phục vụ IO

Làm thế nào hệ thống con đĩa của bạn (có thể chứa nhiều đĩa) đang hoạt động tổng thể.

IOStat (khối / giây đọc / ghi)

Có bao nhiêu khối đĩa được đọc / ghi mỗi giây. Tìm kiếm gai và cũng là trung bình. Nếu trung bình bắt đầu gần thông lượng tối đa của hệ thống con đĩa của bạn, đã đến lúc lập kế hoạch nâng cấp hiệu suất. Trên thực tế, lập kế hoạch theo cách đó trước thời điểm đó.

Entropy có sẵn (byte)

Một số ứng dụng muốn nhận dữ liệu ngẫu nhiên "thật". Kernel tập hợp tính ngẫu nhiên 'thật' từ một số nguồn, chẳng hạn như hoạt động của bàn phím và chuột, trình tạo số ngẫu nhiên được tìm thấy trong nhiều bo mạch chủ hoặc thậm chí từ các tệp video / nhạc (video-entropyd và âm thanh-entropyd có thể làm điều đó).

Nếu hệ thống của bạn hết entropy, các ứng dụng muốn dữ liệu đó bị đình trệ cho đến khi chúng nhận được dữ liệu của chúng. Cá nhân tôi đã từng thấy điều này xảy ra với trình nền Cyrus IMAP và dịch vụ POP3 của nó; nó tạo ra một chuỗi ngẫu nhiên dài trước mỗi lần đăng nhập và trên một máy chủ bận rộn đã tiêu thụ nhóm entropy rất nhanh.

Một cách để thoát khỏi vấn đề đó là chuyển đổi các ứng dụng chỉ sử dụng dữ liệu bán ngẫu nhiên (/ dev / urandom), nhưng đó không còn là chủ đề này nữa.

VMStat (chạy / I / O quá trình ngủ)

Không nghĩ về điều này trước đây, nhưng tôi sẽ nghĩ rằng điều này cho bạn biết về thống kê I / O theo quy trình, hoặc chủ yếu là họ có chạy I / O hay không, và nếu I / O đó đang chặn hoạt động I / O hay không phải.

Thông lượng đĩa trên mỗi thiết bị (byte / giây đọc / ghi)

Đây hoàn toàn là byte đọc / ghi mỗi giây và thường thì đây là dạng dễ đọc hơn con người so với các khối , có thể thay đổi. Kích thước khối có thể khác nhau do các đĩa được sử dụng, hệ thống tệp (và cài đặt của nó) được sử dụng, v.v. Đôi khi kích thước khối có thể là 512 byte, lần khác là 4096 byte, đôi khi là thứ khác.

sử dụng bảng inode

Với các hệ thống tệp có các nút động (như XFS), không có gì. Với các hệ thống tệp có bản đồ inodes tĩnh (như ext3), mọi thứ. Nếu bạn có sự kết hợp của các nút tĩnh, một hệ thống tệp lớn và số lượng lớn thư mục và các tệp nhỏ, bạn có thể gặp phải tình huống không thể tạo thêm tệp trên phân vùng đó, mặc dù về lý thuyết sẽ còn rất nhiều không gian trống. Không có inodes miễn phí == xấu.


xem xét việc sử dụng inode. Tôi hiện đang sử dụng ext4, và các nút tối đa và mã mở trong biểu đồ đó cực kỳ gần (mở: kích thước bảng 31,11k: 32,12k). Mà sẽ để lại cho tôi với khoảng 1k inodes còn lại. Khi hệ thống được cài đặt mới, tôi không tin vấn đề này. Là ext4 tự động phân bổ các nút? Tôi chưa tìm thấy bất cứ điều gì về điều đó trên google ...
shoutuma

Xem df -i, nó báo cáo bạn sử dụng inode hiện tại. ext4 đã sửa lỗi inodes, ví dụ Fedora 16 báo cáo cho phân vùng gốc của tôirootfs 3276800 238083 3038717 8% /
Janne Pikkarainen

Hmmm ... thú vị. Điều này cho thấy đồ thị munin là không chính xác. Tôi cũng không nhận ra rằng biểu đồ munin chỉ hiển thị một giá trị. Nó không nên hiển thị một giá trị cho mỗi hệ thống tập tin là hữu ích? Xem thêm df -iảnh chụp màn hình ( i44.tinypic.com/oixkiq.png ) so với biểu đồ munin ( i39.tinypic.com/dxl64z.png )
shoutuma

... Giá trị trong biểu đồ (25,57k) thực sự không thấy ở dfđầu ra.
shoutuma

Sau khi điều tra thêm, tôi thấy rằng các plugin Munin open_inodes, mất giá trị từ /proc/sys/fs/inode-nr. Đó là một hạt nhân, và không phải là một giá trị hệ thống tệp. Một chút googling đã chỉ cho tôi điều này: mjmwired.net/kernel/Documentation/sysctl/fs.txt#119 Từ tài liệu đó tôi sẽ cho rằng giới hạn có thể được tìm thấy inode-max. Nhưng tập tin này không tồn tại trên hệ thống của tôi. Có thể là điều này không còn thích hợp trên các hạt nhân mới hơn? Điều này sẽ cho phép tôi xóa biểu đồ này khỏi ví dụ munin của tôi!
shoutuma
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.