Giám sát chiến lược cho cơ sở hạ tầng


12

Gần đây, tôi đã phải đối mặt với một số thời gian chết trên một số trang web Drupal tôi đã triển khai. Tôi muốn tiếp cận vấn đề một cách chủ động, thay vì phản ứng với những thời gian ngừng hoạt động đó bằng cách khởi động lại các dịch vụ hoặc chính máy chủ. Tôi đã đọc về các công cụ giám sát như nagios, munin, cacti, v.v để theo dõi sức khỏe của máy chủ / cơ sở hạ tầng của bạn, nhưng tôi chưa thực sự thử một sản phẩm nào. Tôi giao dịch với Drupal gần như 99% và tôi muốn tìm hiểu các đề xuất cho cả giám sát cấp độ máy chủ và giám sát cấp độ Drupal (mã ứng dụng).

Về cơ bản, tôi muốn được thông báo khi tải máy chủ cao, có thể bị chỉ ra thủ phạm (hoặc nạn nhân), để tôi có thể đưa ra quyết định sáng suốt. Tôi cũng muốn biết những gì mọi người sử dụng để theo dõi mức độ Drupal (chẳng hạn như gửi email) khi có lỗi / cảnh báo PHP. (Điều gì xảy ra khi máy chủ email tự tắt?)

Câu trả lời:


6

Nếu bạn muốn theo dõi một số trang web Drupal từ cùng một nơi với các cảnh báo, v.v ... Tôi có thể nói bạn không phải là người duy nhất. Nó bắt đầu trở thành một lĩnh vực kinh doanh, đến bây giờ được lấp đầy bởi:

Cả hai đều là phương pháp tiếp cận SaaS thương mại, với các tùy chọn giới hạn miễn phí để dùng thử dịch vụ.

Ngoài ra còn có tùy chọn giám sát Zabbix mã nguồn mở với mô-đun Drupal http://drupal.org/project/zabbix , nhưng sau đó bạn nên định cấu hình và tự xây dựng máy chủ.

Tất cả các tùy chọn này có các mô-đun Drupal của chúng để gửi máy chủ và thông tin cụ thể về drupal đến máy chủ giám sát.

CẬP NHẬT. Munin cũng có một Mô-đun Drupal cụ thể , với chi nhánh 2.x dựa trên Drush.


Tôi đã thử di tích mới với drupal và tôi phải nói rằng nó thực sự rộng rãi theo cách tốt trong hầu hết thời gian (xhprof ít nhiều là một thay thế tốt cho dấu vết giao dịch trong NR nhưng việc thu thập dữ liệu là không thể vượt qua). Cũng đã được nghe về drupal.org áp dụng nagios để theo dõi, Cảm ơn câu trả lời của bạn, tôi sẽ đợi thêm vài ngày nữa cho cặp đôi nữa trước khi chọn nó.
Dipen

5

Bất kể bạn sử dụng loại nào, một điều tôi chắc chắn sẽ đề xuất là, trừ khi bạn có một nhân viên CNTT toàn thời gian, không duy trì sự giám sát của riêng bạn: dựa vào một dịch vụ hoàn toàn độc lập với máy chủ của bạn. Đó là một điều khiến máy chủ phải đối mặt công khai, đó là một vấn đề khác khiến nó ngừng hoạt động và không biết về nó vì máy chủ giám sát của bạn cũng bị hỏng. Hầu hết các dịch vụ giám sát sẽ bao gồm tất cả các yêu cầu bạn đã liệt kê ra khỏi hộp.

Nhưng có nguy cơ bị biến thành câu hỏi gợi ý mua sắm, dịch vụ tôi sử dụng cho các yêu cầu bạn đã liệt kê là Pingdom :

  • Cho bạn biết nếu một trang web lên (tất nhiên)
  • Đo thời gian trả lời
  • Đo lường mức độ đáp ứng và tính khả dụng trên bất kỳ cổng TCP / UDP tùy chỉnh nào
  • Kiểm tra tính khả dụng của email
  • Cho phép các yêu cầu HTTP tùy chỉnh, cho phép bạn kiểm tra các khía cạnh khác nhau của ứng dụng của bạn
  • Báo cáo mở rộng
  • Giám sát trên toàn thế giới và họ thêm khoảng một chục trang web theo dõi mỗi vài tháng

Tôi đã sử dụng site24x7.com và cả pingdom (cho một trang khác) để cảnh báo, tôi muốn theo dõi chủ động cho tôi biết về việc sử dụng tài nguyên hoặc các vấn đề tiềm ẩn và tích hợp chặt chẽ với môi trường máy chủ. Cảm ơn câu trả lời của bạn.
Dipen

2

Đây là một số gợi ý về thuyết bất khả tri của Drupal:

  • Các trang web của tôi lên sẽ định kỳ ping (các) máy chủ của bạn và sẽ gửi email cho bạn (hoặc SMS nếu bạn nhận được gói không miễn phí) nếu trang web của bạn ngoại tuyến hoặc không phản hồi.
  • Load Impact là một công cụ miễn phí tuyệt vời khác có thể kiểm tra căng thẳng trang web của bạn để bạn có thể biết chính xác khi nào nó bắt đầu bị lỗi.

Theo như ứng dụng Drupal, tôi khuyên bạn nên sử dụng Xdebug + Webgrind hoặc XHProf để lập hồ sơ mã và theo dõi câu hỏi này: Cách tốt nhất để đánh giá hiệu năng ngăn xếp Drupal


Cảm ơn đã cho tôi biết về tác động của tải, tôi đã sử dụng jmeter nhưng sau đó, công việc thiết lập kế hoạch kiểm tra của bạn sẽ hiệu quả hơn. Tôi hy vọng tác động tải có thể giải quyết các mô phỏng xác thực drupal.
Dipen

1

Tôi thích pingdom cho các trang web vừa / nhỏ bởi vì nó hữu ích: nó cho bạn biết rằng Cái gì đó sai từ quan điểm của khách hàng, có thể thực hiện được. Những thứ như tải trung bình thực sự không có ý nghĩa gì trừ khi bạn có một ngăn xếp được định cấu hình sai (mà bạn không nên) hoặc bạn bị búa từ Digg / Reddit (trong trường hợp đó bạn không thể làm gì được, dù sao bạn cũng không thể làm gì chuẩn bị).

Từ blog của Ted Dziuba:

Tôi gọi những loại cảnh báo này là Cool Story, Bro. Đây là những bit thông tin không chỉ ra bất kỳ loại trạng thái vấn đề nào và không nhắc bất kỳ hành động nào. Câu chuyện thú vị là những điều mà bạn thậm chí không nên có thông báo. Họ lãng phí thời gian của bạn và làm cho bạn hoang tưởng. Thông báo của Cool Story Bro là những thứ như:

  • Trung bình tải trên một máy chủ là trên 20.
  • Một hàng đợi công việc có nhiều hơn X đơn vị công việc trong đó. Xin chúc mừng, đồ ngốc, hàng đợi của bạn đang làm chính xác những gì nó phải làm.
  • Một số số liệu lớn hơn một trung bình xác định theo kinh nghiệm. Tôi bị xúc phạm cá nhân bởi shit như thế này.

Đọc bài viết trên blog, nó rất vui nhộn.


0

Tôi đang sử dụng check_drupal để theo dõi các trang web drupal khác nhau. Đây là một plugin nagios không yêu cầu bất kỳ thay đổi mã nào đối với một trang web drupal. Yêu cầu duy nhất là drush cần phải có mặt trên máy chủ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.