Để biết danh sách toàn diện hơn về các công cụ giám sát và các tính năng của chúng, hãy xem trang Wikipedia này .
Như câu hỏi nêu, các công cụ được sử dụng phổ biến nhất được sử dụng cho nhiệm vụ này là gì và điểm mạnh và điểm yếu của chúng là gì?
Để biết danh sách toàn diện hơn về các công cụ giám sát và các tính năng của chúng, hãy xem trang Wikipedia này .
Như câu hỏi nêu, các công cụ được sử dụng phổ biến nhất được sử dụng cho nhiệm vụ này là gì và điểm mạnh và điểm yếu của chúng là gì?
Câu trả lời:
Tôi đã sử dụng Nagios trong quá khứ với thành công. Nó rất mở rộng (hơn 200 tiện ích bổ sung), tương đối dễ sử dụng và nhiều báo cáo. Một tiêu cực sẽ là thiết lập ban đầu.
Cacti là một frontend dựa trên web rất tốt cho RRDTool , cung cấp các biểu đồ và số liệu thống kê rất tiện dụng. RRDTool là phần tập hợp dữ liệu từ nhiều hệ thống và giám sát một loạt các dữ liệu kỹ thuật.
Chúng tôi đang sử dụng giải pháp cacti / RRDTool đó để giám sát các hệ thống Unix và Windows. Chúng tôi nhận được rất nhiều số liệu hữu ích bao gồm tải, sử dụng CPU / RAM, không gian HD, người dùng đăng nhập, lưu lượng mạng, quy trình đang chạy, v.v.
Bạn sẽ tìm thấy thêm thông tin về xương rồng trên Cacti là gì? trang.
Cá nhân, tôi yêu Munin rất dễ cài đặt và viết các plugin vì nó có kiến trúc rất đơn giản. Có khá nhiều plugin đã xuất hiện cho tất cả các mục đích bạn có thể tưởng tượng, vì vậy bạn có thể thậm chí sẽ không phải viết plugin ngay từ đầu.
Nó cũng cung cấp các biểu đồ đẹp và tùy chọn để cấu hình các cảnh báo (rất cơ bản).
Zabbix . Đó là nguồn mở và đơn giản để thiết lập và tùy chỉnh. Chúng tôi có rất nhiều tập lệnh giám sát tùy chỉnh cung cấp cho máy chủ zabbix, nhưng nó tập trung vào việc tập trung dữ liệu đó, hiển thị một cách thích hợp, thông báo (email, IM, SMS, twitter, v.v.), v.v.
Tôi đã và đang triển khai Spiceworks tại công ty của chúng tôi và chúng tôi đang tìm thấy nó là một công cụ tuyệt vời không chỉ để theo dõi các máy chủ mà còn mọi thứ khác trên mạng.
Nó thực hiện những việc như kiểm kê tự động và giám sát tùy chỉnh để gửi email cho bạn khi có sự cố (EG: Máy in giảm tới 10% mực hoặc ổ cứng của máy chủ này có 20%).
Nhược điểm của nó có lẽ là mật độ thông tin trên mỗi máy tính, đừng hiểu nhầm nó có RẤT NHIỀU dữ liệu trên mỗi máy nhưng đối với những thứ như máy chủ mà bạn có thể muốn có nhiều số liệu thống kê bạn có thể cần sử dụng một công cụ khác.
EDIT: oh tôi đã đề cập đến mô hình kinh doanh của nó dựa trên nó là miễn phí mãi mãi.
Hút thuốc không chỉ kiểm tra sự sẵn có của các máy chủ và dịch vụ khác nhau mà còn theo dõi độ trễ của chúng trong khi cung cấp các biểu đồ dễ sử dụng, dễ nhìn và nhanh chóng để hiển thị.
Một loạt các plugin đo độ trễ có sẵn ngoài hộp. Nếu bạn biết một số Perl, thật dễ dàng để tạo ra những cái của riêng bạn cho bất kỳ nhu cầu kỳ lạ nào.
Cài đặt lớn sẽ được hưởng lợi từ Hệ thống Master / Slave cho phép đo phân tán.
Hệ thống cảnh báo có cấu hình cao sẽ giúp bạn nhận thấy các vấn đề trước khi chúng bắt đầu ảnh hưởng đến người dùng hoặc tiến triển thành mất điện lớn.
Khói thuốc là miễn phí và Phần mềm OpenSource được viết bằng Perl bởi Tobi Oetiker, người tạo ra MRTG và RRDtool
OpenNMS được sử dụng ở nơi tôi làm việc để giám sát hơn một nghìn máy Linux. Chúng tôi giám sát phần cứng của từng máy và các ứng dụng chạy trên chúng.
Zenoss Core là một số ứng dụng, Chúng tôi đang sử dụng nó (trong khoảng một năm) để giám sát nhẹ các máy chủ, bộ chuyển mạch mạng và UPS.
Zenoss Core là một sản phẩm giám sát CNTT nguồn mở đã giành giải thưởng, quản lý hiệu quả cấu hình, sức khỏe và hiệu suất của các mạng, máy chủ và ứng dụng thông qua một gói phần mềm tích hợp duy nhất.
Nagios là tuyệt vời vì nó miễn phí và có rất nhiều plugin cho nó. Tuy nhiên, UI và config rất khó.
Nó hoàn toàn trái ngược với pro / con cũng rất tuyệt vời là Microsoft System Center Operations Manager (SCOM) không miễn phí, có ít plugin hơn nhưng thiết lập và cấu hình rất tuyệt vời và dễ dàng.
Tôi phải thừa nhận nếu tôi ở trong một công ty chủ yếu của Microsoft, có yêu cầu phụ thuộc rất cao (nghĩa là không đủ khả năng giám sát để phá vỡ) hoặc phải suy nghĩ về việc khiến các nhà phát triển làm việc với nó thì SCOM sẽ là đề xuất của tôi đối với Nagios.
Tôi đã sử dụng:
Chúng tôi sử dụng AlertFox từ một vài tuần và rất vui vì điều đó. Nó không chỉ kiểm tra thời gian hoạt động và hiệu suất của chúng tôi, mà còn giám sát giỏ hàng, đăng nhập của người dùng và các phần quan trọng khác của trang web thông qua các tập lệnh giao dịch (dựa trên iMacros).
Để giám sát nội bộ của chúng tôi (không gian đĩa, v.v.), chúng tôi sử dụng Nagios .
Là một người Windows, MOM. Chúng tôi đang tìm cách nâng cấp lên Trình quản lý hoạt động của Trung tâm hệ thống (SCOM) nhưng sẽ không cần đến khi chúng tôi bắt đầu triển khai Windows 2008.
Tôi là một phần của dự án nâng cấp giám sát hoạt động. Chúng tôi đã có nhiều nhà cung cấp khác nhau đến để trình bày một vài hệ thống đô la lớn và trộn lẫn trong một số lựa chọn thay thế rẻ hơn để so sánh.
Một trong số đó là Hyperic , cũng có sẵn như là một giải pháp nguồn mở miễn phí. Tôi rất ấn tượng với khả năng cung cấp và khả năng mở rộng của nó cho các đại lý tùy chỉnh.
Để theo dõi số liệu thống kê (sử dụng bộ nhớ, tải, hoạt động mysql, hoạt động apache, v.v.) tôi sử dụng Munin . Ra khỏi hộp nó đã theo dõi rất nhiều thứ và đồ thị cho các khoảng thời gian khác nhau (24 giờ qua, 7 ngày qua, tháng trước, năm ngoái). Thông qua các plugin thậm chí nhiều thứ có thể được theo dõi. Đầu ra của nó là các trang HTML với các biểu đồ đẹp.
Munin có kiến trúc chính / nút: các nút thu thập số liệu thống kê trên máy chủ và chủ lưu trữ dữ liệu và tạo HTML và biểu đồ.
Tôi sử dụng Monit để theo dõi các quá trình đang chạy và để khởi động lại hoặc cảnh báo cho tôi khi có một số điều kiện cấu hình nhất định (tải cpu cao, sử dụng bộ nhớ cao, không có phản hồi HTTP, v.v.) Monit cũng có thể theo dõi những điều chung hơn về máy chủ, chẳng hạn như cpu tải, sử dụng bộ nhớ, trạng thái ổ cứng hoặc sử dụng đĩa.
Monit cần được cấu hình cho mọi dịch vụ hoặc phần cứng bạn muốn theo dõi và cách phản hồi khi có sự cố. Các tùy chọn được sử dụng nhiều nhất là không làm gì, gửi email cảnh báo hoặc khởi động lại dịch vụ.
Monit là tuyệt vời khi nó hoạt động, nhưng đôi khi nó không khởi động, dừng hoặc khởi động lại một dịch vụ và không có nhiều thông tin chẩn đoán có sẵn để cho bạn biết những gì đã sai. Điều này có nghĩa là bạn không biết liệu sự cố xảy ra với dịch vụ của bạn hay với cấu hình Monit, hoạt động với môi trường tối thiểu giống như cron.
Cả hai công cụ đều có sẵn theo mặc định trên hầu hết các bản phân phối Linux.
Tôi ngạc nhiên không ai đề cập đến logwatch hoặc logcheck cho máy chủ linux - tiết kiệm rất nhiều thời gian đọc nhật ký !!
Tôi sử dụng Pingdom để theo dõi máy chủ của mình. Nó sẽ gửi cho tôi một tin nhắn SMS khi máy chủ không thể truy cập được.
Dự án của chúng tôi sử dụng Ganglia cho hơn 100 cụm nút của chúng tôi. Một lý do chúng tôi sử dụng nó là vì nó là công cụ giám sát đi kèm với Rocks .
Điều quan trọng đối với chúng tôi là có chi phí rất thấp trên mỗi nút để có càng nhiều tài nguyên có thể có sẵn để tính toán. Ganglia cho chúng ta một cái nhìn tổng quan về cụm và cho phép chúng ta đi sâu vào từng nút riêng lẻ nếu cần. Bên cạnh việc biết những gì đang diễn ra ngay bây giờ, chúng ta có thể có một cái nhìn khá tốt về những gì đã xảy ra trong giờ, ngày, tuần, tháng và năm qua. Các biểu đồ của số liệu thống kê khác nhau là cơ bản và chức năng.
Tất cả phụ thuộc vào những gì bạn có nghĩa là "màn hình"!
Một người mới tham gia vào hiện trường để kiểm tra việc cạnh tranh với Cacti và các giải pháp dựa trên RRDTool là Graphite ( http://graphite.wikidot.com/ )
RRDTool được thay thế bằng một cửa hàng sao lưu có tên Whisper. Các tài liệu cung cấp một cái nhìn tổng quan khá tốt về lý do tại sao nó khác biệt và tôi thực sự thích CLI cho biểu đồ ad hoc khi điều tra một cái gì đó.
Chúng tôi sử dụng (và thích) WhatsUp từ Ipswitch cho mạng Windows tương đối nhỏ của chúng tôi. Nó rất dễ cài đặt và tương đối dễ quản lý và biết cách xử lý các máy chủ Windows cũng như các công cụ tiêu chuẩn.
Đối với các mạng lớn hơn, các mạng không định hướng Windows hoặc các mạng có nhiều nội dung khác nhau, tôi chân thành khuyên bạn nên OpenNMS . Phần mềm OpenNMS nếu miễn phí và công ty rất vui khi bán các dịch vụ hỗ trợ và triển khai. Nó cũng được điều hành bởi một người bạn rất sắc sảo của tôi từ thời đại học!
Đối với những người không thích giao diện web Nagios, có NPC , một plugin cho Cacti giúp giao diện người dùng Nagios có sẵn từ bên trong Cacti, nhưng có ngoại hình đẹp hơn (ajax, v.v.).
Nó đọc từ cơ sở dữ liệu được cung cấp bởi NDO2DB , đây là một cách tuyệt vời để có sẵn cơ sở hạ tầng của bạn từ bên trong cơ sở dữ liệu để sử dụng trong các tập lệnh và các công cụ khác.
Hiện tại chúng tôi sử dụng PRTG từ Paessler . Nó là tuyệt vời. Không yêu cầu đại lý, giao diện web Ajax tuyệt vời, ghi nhật ký lịch sử, vẽ đồ thị, WMI, v.v. Có phiên bản 10 cảm biến có sẵn miễn phí nhưng chúng tôi đã đưa ra một vài phiên bản lớn cho phiên bản doanh nghiệp. Tiền chi tiêu tốt.
Hobbit - đó là phiên bản nhanh hơn của Big Brother (có vẻ như đáng báo động trong những ngày này).
Nếu bạn đang vội và muốn có một công cụ nhanh chóng để giám sát máy chủ MS của mình thì hãy sử dụng trình theo dõi hiệu suất cho các cửa sổ, thiết lập nhật ký truy cập với mẫu giám sát tùy chỉnh và lịch trình lưu trữ (ví dụ: thu thập dữ liệu trong 5 phút mỗi giờ). Sau đó tải xuống Công cụ Phân tích Hiệu suất Nhật ký (PAL) của Microsoft ( http://pal.codeplex.com/ ) để truy cập nhật ký truy cập của bạn. PAL sẽ tạo một báo cáo tài liệu tuyệt vời với các liên kết đến các tài liệu / công cụ giải quyết vấn đề có thể.
Tôi sử dụng kết hợp Solarwinds, tab hiệu suất máy chủ VMware và tập lệnh tùy chỉnh.
Giám sát hiệu suất mạng Solarwinds Orion là những gì tôi sử dụng với các hệ thống Windows của chúng tôi. quản trị viên trên máy chủ web của tôi. Vẫn nhận được một số số liệu ứng dụng hữu ích chạy trên nó, nhưng nó có thông tin tốt về các công cụ cấp hộp cơ bản (đĩa, mạng, CPU).
Đối với khách VMware của tôi, tôi thích các tab hiệu suất.
Đối với các máy chủ Sun của tôi, khi tôi cần thứ gì đó không có sẵn trong Solarwinds (vì quản trị viên của chúng tôi chưa thêm nó hoặc cái gì), tôi viết các tập lệnh tùy chỉnh (thường là trong Perl) để theo dõi những thứ như sức khỏe gương, sử dụng trao đổi, v.v.
Tôi muốn nhận được nhiều hơn vào Solarwinds, nhưng chỉ có 26 giờ mỗi ngày (hoặc vì vậy ông chủ của tôi tin tưởng) vì vậy tôi thấy đó có thể là một hạn chế ...
Chúng tôi sử dụng OpsView , chạy trên đỉnh Nagios. WebUI giúp chúng tôi triển khai các định nghĩa giám sát máy chủ mới mà không phải cho phép truy cập SSH, cung cấp chế độ xem công khai và ghi lại các giá trị lịch sử. Điều này rất thuận tiện cho việc cung cấp và xác định đường cơ sở phù hợp.
Zabbix ( http://www.zabbix.com ) cũng tốt và dễ cài đặt hơn Nagios.
Xin lỗi để nói nhưng cuối cùng tôi đã sử dụng rất nhiều tập lệnh tùy chỉnh. Trong khi xa lý tưởng tôi nghi ngờ có một giải pháp phổ biến hơn.
Chúng tôi đã viết phần mềm giám sát riêng của chúng tôi. Mã của chúng tôi không phức tạp như gói thương mại, nhưng chúng tôi không cần nhiều chức năng. Việc viết riêng của chúng tôi dễ dàng hơn là điều tra các gói khác và tìm hiểu cách sử dụng chúng. Mã này thực hiện đúng những gì chúng ta muốn và thật dễ dàng để mở rộng.