Chiến lược phát hiện trôi thời gian trong một trung tâm dữ liệu dựa trên linux là gì?


14

Chiến lược phát hiện trôi thời gian trong tất cả các trung tâm dữ liệu dựa trên linux là gì? Đây là một vấn đề khó khăn hơn so với lúc đầu.

Thời gian trôi có thể gây ra vấn đề nghiêm trọng cho một số ứng dụng nhất định và thường, mặc dù NTP đã được cài đặt, nhưng có thể thất bại vì những lý do sau (và nhiều lý do khác):

  • NTP không được thiết lập chính xác để tự động khởi động lại khi khởi động lại.
  • Các cài đặt trên máy chủ không chính xác nên máy chủ thời gian mà nó trỏ đến không thể truy cập được hoặc không chính xác.
  • Máy chủ thời gian chính không thể truy cập được và tất cả các máy chủ đang đồng bộ hóa với nó hiện đang đồng bộ hóa với một nguồn không đáng tin cậy.

Tôi muốn một cách để phát hiện nếu tất cả các máy chủ cá nhân là chính xác. Hãy nhớ rằng máy chủ với tập lệnh / ứng dụng thử nghiệm có thể không đúng.


6
Tôi nghĩ lý do của bạn là không có thật, NTP hoạt động là rất quan trọng cho trang trại. Đảm bảo những gì NTP đang hoạt động đúng. Ngoài ra, triển khai một đồng hồ chủ địa phương.
dùng539484

NTP hoạt động vượt trội trên nhiều bản phân phối Linux hiện có các mặc định hợp lý. Bây giờ nó không còn là vấn đề nữa.
Matt

Câu trả lời:


20

Điều này là dễ dàng để kiểm soát. Quản lý cấu hình là chìa khóa ...

Đảm bảo rằng dịch vụ ntp đang chạy và được định cấu hình ...

Ví dụ, sử dụng Monit để đảm bảo ntpdđang chạy và khởi động lại nếu thất bại là một cách tiếp cận dễ dàng ... Có thể có ý nghĩa khi thêm cron và các trình nền thiết yếu khác vào loại kiểm tra đó.

Một tùy chọn khác là sử dụng một công cụ quản lý cấu hình như Puppet để buộc cùng ntpd.conf vào máy chủ của bạn và đảm bảo rằng ntpd được cài đặt, định cấu hình và chạy.

Có đủ các khoản dự phòng trong giao thức NTP để xử lý trường hợp máy chủ thời gian không thể truy cập được. Chỉ định nhiều nguồn.


3
Tôi phải lặp lại tình cảm này. Quản lý cấu hình và nhiều máy chủ NTP là một phần cơ bản của cơ sở hạ tầng trong bất kỳ thứ gì tiếp cận với "trung tâm dữ liệu". Một trung tâm dữ liệu trung bình hoặc lớn hơn nên có đồng hồ phần cứng. Nguồn thời gian GPS có thể được mua trong vài trăm và nếu bạn có bàn hàn <$ 100.
Chris S

giải pháp này + nagios
anh chàng đó từ đó

4
Lưu ý rằng cách bạn kiểm tra ntpdtrạng thái là khá quan trọng. Bạn không muốn chỉ nói "ntpd đang chạy. Mọi thứ đều tuyệt vời!". Bạn thực sự phải xác minh rằng hệ thống của bạn đang đồng bộ hóa và có một chức năng ngang hàng hoặc bù thời gian là tối thiểu giữa máy chủ và hộp giám sát . Nagios có check_ntp_peercheck_ntp_timexử lý việc đó, nếu bạn muốn sử dụng Nagios.
voretaq7

ntpq để kiểm tra trạng thái
kubanchot

10

Có rất nhiều plugin check_ntp cho nagios ngoài kia.

Đây là một:

http://nagiosplugins.org/man/check_ntp

Thêm kiểm tra này vào máy chủ nagios của bạn và nhận thông báo nếu có gì bất ổn.


Yup, chỉ cần thiết lập hệ thống giám sát của bạn để kiểm tra xem thời gian có hợp lệ hay ít nhất là phần bù so với hệ thống giám sát là tối thiểu.
Zoredache
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.