Giám sát máy chủ sản xuất [đã đóng]


18

Chúng tôi có 3 máy chủ chuyên dụng, được chia nhỏ trong một số VPS bằng openVZ. Chúng tôi đang sử dụng munin để giám sát VPS với các trang web sản xuất và kiếm tiền trên một số VPS để đảm bảo nó khởi động lại dịch vụ khi bị lỗi.

Điều quan trọng là chúng tôi cần một cách tốt hơn để giám sát tất cả các máy chủ của mình, vì chúng tôi có tới 14 VPS, chúng tôi muốn có một trung tâm trung tâm nơi chúng tôi có thể xem không chỉ dữ liệu được thu thập bởi munin, mà còn có thêm một số thống kê bổ sung trên các mạng và biểu diễn dịch vụ của chúng tôi.

Một số yêu cầu của chúng tôi:
- Thông báo SMS về lỗi (khả năng thiết lập xác minh tùy chỉnh nhất định)
- Trình phân tích nhật ký cho apache error_log và một số khác.
- Phải là trung tâm (có nghĩa là một máy chủ và một số nút thu thập dữ liệu).
- Không cần dễ cài đặt nhưng dễ bảo trì.
- Cần được tự do

Tôi đã được chỉ vào nagios và splunk, bạn nghĩ gì? Cảm ơn,

Câu trả lời:


17

Tôi có một thiết lập tương tự, ngoại trừ với Xen tại chỗ. Tôi đã rất hạnh phúc với sự kết hợp của:

  • Nagios để cảnh báo (sử dụng PNP cho một số biểu đồ nhỏ và Nagviz cho bảng điều khiển trạng thái dịch vụ)
  • Ganglia cho đồ thị lịch sử của các hệ thống
  • OSSEC với tư cách là một HIDS và quan trọng không kém là người thu thập để ghi nhật ký tập trung
    • sidenote: Có một plugin Splunk cho OSSEC tích hợp hai công cụ này rất tốt, tôi đang chờ đợi chúng chuyển nó sang Splunk v4.
  • Splunk Cuối cùng, một khi một vài plugin Splunk được di chuyển qua, chúng tôi dự định sử dụng Splunk với một số bản ghi trước của nhật ký (để tránh đi qua nắp phiên bản miễn phí)

Tôi hy vọng rằng việc chia sẻ thiết lập giám sát của chúng tôi sẽ giúp bạn hiểu :-)

Dưới đây là một số liên kết hữu ích:

http://www.ibm.com/developerworks/linux/l Library / l-ganglia-nagios-1 / index.html

https://www.ibm.com/developerworks/linux/l Library / l-ganglia-nagios-2 /

http://www.ossec.net/main/splunk-ossec-integration

cập nhật:

Tôi quên đề cập đến việc chúng tôi cũng sử dụng bố cục cấu hình Matt Simmons Nagios, được tìm thấy ở đây http://www.standopol-sysadmin.com/blog/2009/07/nagios-config/

Bố cục này làm cho Cấu hình Nagios của chúng tôi lành mạnh và dễ bảo trì hơn nhiều (Cảm ơn Matt!)


2
+1 cho OSSEC + splunk. họ làm việc rất tốt với nhau
sucuri

5

Tôi đã thành công lớn với Zabbix , nó đáp ứng tất cả các điểm của bạn trong một gói.

văn bản thay thế
(nguồn: zabbix.com )

Phần khó nhất sẽ là theo dõi nhật ký apache, nhưng Zabbix có thể mở rộng để bạn có thể sử dụng LogWatch hoặc một số tập lệnh perl khác để lấy dữ liệu cho bạn.


2

Tôi thích OpManager và nó miễn phí tới một số nút nhất định. Có tất cả các điều trên, và khá dễ dàng để cài đặt và bảo trì.


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.