Chúng tôi có một máy chủ Graphite để thu thập dữ liệu thông qua colld, statsd, JMXTrans ... Kể từ vài ngày, chúng tôi thường xuyên có lỗ hổng trong dữ liệu của mình. Đi sâu vào dữ liệu chúng ta vẫn có, chúng ta có thể thấy kích thước bộ đệm carbon tăng (từ 50K lên 4M). Chúng tôi không thấy sự gia tăng số lượng số liệu được thu thập (metricsReceured ổn định ở mức khoảng 300K). Chúng tôi có sự gia tăng số lượng truy vấn trung bình từ 1000 đến 1500.
Thật kỳ lạ, cpuUsage giảm nhẹ từ 100% (chúng tôi có 4 CPU) xuống 50% khi kích thước bộ đệm tăng.
Thật kỳ lạ, một lần nữa, chúng ta lại thấy sự gia tăng số lượng nếu các octet đọc từ đĩa và giảm số lượng octet được viết.
Chúng tôi có cấu hình carbon chủ yếu với các giá trị mặc định:
- MAX_CACHE_SIZE = inf
- MAX_UPDATE_PER_SECOND = 5000
- MAX_CREATE_PER_MINUTE = 2000
Rõ ràng, một cái gì đó đã thay đổi trong hệ thống của chúng tôi, nhưng chúng tôi không hiểu điều gì, cũng như làm thế nào chúng tôi có thể tìm thấy nguyên nhân này ...
Có ai giúp đỡ không?