Làm thế nào mà một trong những thiết bị chuyển mạch của tôi bị tắt sau hai phút mặc dù ntp?


11

Tôi chỉ nhận thấy một cơ hội thuần túy rằng một trong những thiết bị chuyển mạch Cisco 4500 của tôi có đồng hồ bị lỗi: chậm hơn 2 phút mặc dù có vẻ như không hoạt động. Theo tôi, thậm chí một giây không nên được coi là chấp nhận được đối với các hệ thống liên quan. Ngoài ra, tôi sẽ không nhận thấy sự khác biệt từ chẩn đoán, nếu tôi không so sánh nó với một chiếc đồng hồ treo tường đơn giản.

Một số chi tiết

Đây là thông tin ntp cho một số máy chủ của tôi (10.0.99.1, 10.0.99.2, 10.0.1.119, 10.0.99.241) một phần tham chiếu lẫn nhau cho dự phòng, nhưng chủ yếu cuối cùng là bằng cách đồng bộ hóa với 10.0.0.1, một lần nữa kéo Thời gian từ bên ngoài. Vì vậy, sự khác biệt về thời gian không thể dẫn đến từ các nguồn thời gian ban đầu khác nhau. Vì các quan sát khiến tôi hơi hoang tưởng, "có thời gian chính xác" theo các cách sau: show clock(hoặc date) tạo ra một đầu ra khớp với đồng hồ treo tường và đồng hồ hệ thống cục bộ của tôi (cũng ổn theo http://time.is ) với một lỗi chắc chắn dưới 1 giây (độ chính xác của tôi nhấn ENTER trong khi xem đồng hồ cục bộ của tôi)

10.0.1.119 (Ubuntu) có thời gian chính xác

$ ntpq -np
     remote           refid      st t when poll reach   delay   offset  jitter
==============================================================================
+10.0.99.1       10.0.0.1         3 u  855 1024  377    0.904   -2.658   0.113
*10.0.0.1        130.149.17.8     2 u  266 1024  377    0.253    0.909   0.127

10.0.99.241 (Cisco 2960) có thời gian chính xác

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.99.1       10.0.0.1         3     28     64   377  1.462  85.288 19.758
+~10.0.99.2       10.0.1.119       4     29     64   377  1.297  83.515  5.369
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.2 (Cico 4500) có thời gian chính xác

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
+~10.0.99.1       10.0.0.1         3      6   1024   111  1.148  -1.618 42.875
*~10.0.1.119      10.0.0.1         3     31   1024   377  0.043   1.687  1.064
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

10.0.99.1 (Cisco 4500) tụt lại sau khoảng 2 phút 6 giây

#sho ntp associations 

  address         ref clock       st   when   poll reach  delay  offset   disp
*~10.0.0.1        130.149.17.8     2    274   1024   377 15.625   3.681 30.403
+~10.0.99.2       10.0.1.119       4    415   1024   376 15.625   0.855 33.276
 * sys.peer, # selected, + candidate, - outlyer, x falseticker, ~ configured

#sho ntp status 
Clock is synchronized, stratum 3, reference is 10.0.0.1      
nominal freq is 250.0000 Hz, actual freq is 249.9988 Hz, precision is 2**6
reference time is DAD8B428.54C6BAEA (20:36:24.331 MESZ Sat May 7 2016)
clock offset is 3.6818 msec, root delay is 32.80 msec
root dispersion is 71.74 msec, peer dispersion is 30.40 msec
loopfilter state is 'CTRL' (Normal Controlled Loop), drift is 0.000004720 s/s
system poll interval is 1024, last update was 683 sec ago.

Câu hỏi

  1. Làm thế nào đến 10.0.99.1 là quá xa?
  2. Làm thế nào mà các hệ thống đồng bộ hóa với 10.0.99.1 là chính xác?
  3. Tôi nên học như thế nào từ đầu ra của sho ntp statusngày 10.0.99.1 rằng đồng hồ thực sự không đồng bộ (so với tất cả các máy chủ và đồng hồ tham chiếu được đề cập trong sho ntp asso)? Đối với tôi đầu ra trông hoàn toàn giống như một "Tôi hoàn toàn hạnh phúc".

EDIT: Theo nhu cầu phổ biến, đầu ra củasho clock detail

10.0.99.1

#sho clock detail 
13:06:38.605 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

10.0.99.2

#sho clock detail 
13:10:54.083 MESZ Tue May 10 2016
Time source is NTP
Summer time starts 02:00:00 MEZ Sun Mar 27 2016
Summer time ends 03:00:00 MESZ Sun Oct 30 2016

Tôi không thể phát hiện bất kỳ hệ thống nào có địa chỉ IP bạn đã định cấu hình là máy chủ ntp được sử dụng bởi mỗi thiết bị. Và tôi phát hiện ra một vòng lặp cũng như một cặp vợ chồng sử dụng nhau như các máy chủ ntp. Tôi tin rằng trong những trường hợp bạn phải chỉ định chúng là đồng nghiệp ntp chứ không phải máy chủ. Mặc dù tôi phải thừa nhận rằng tôi không biết chính xác sự khác biệt của nó cho dù bạn chỉ định nó là ngang hàng hay máy chủ. Ngoài ra, tôi không tin rằng đó là một ý tưởng tốt để cho mọi thứ được đồng bộ hóa thông qua một máy chủ duy nhất ( 10.0.0.1). Nhưng tôi không nghĩ rằng bất kỳ quan sát nào của tôi có thể giải thích trực tiếp nguyên nhân của vấn đề hiện tại của bạn.
kasperd

2
Một vấn đề rõ ràng với cấu hình ntp của bạn là mỗi máy chủ được cấu hình với số lượng nguồn thời gian tồi tệ nhất có thể. "Một người đàn ông có một chiếc đồng hồ biết thời gian là mấy giờ, một người đàn ông có hai chiếc đồng hồ không bao giờ chắc chắn ..." Bất kỳ số nào khác tốt hơn hai, bốn có lẽ là sự lựa chọn tốt nhất, nó cung cấp một đệm nếu không có sẵn và vẫn rời đi ba nguồn.
dfc

4
Toàn bộ cấu hình NTP của bạn cần được xem xét lại. Bạn cần phải làm việc với các cấp độ tầng. Như @kasperd đã chỉ ra, bạn có thể gặp vấn đề với một vòng lặp. Bạn chỉ nên đồng bộ hóa với các máy chủ có mức tầng thấp hơn và những máy chủ ở cùng cấp tầng có thể được xem, nhưng không được sử dụng lẫn nhau làm máy chủ. Các thiết bị ngang hàng vẫn cần một hoặc nhiều máy chủ ở cấp tầng thấp hơn dưới dạng nguồn có thẩm quyền, nhưng sẽ cố gắng căn chỉnh với các máy ngang hàng khác. Không sử dụng các thiết bị bận (ví dụ: bộ chuyển mạch lõi) làm máy chủ NTP.
Ron Maupin

3
Một cái gì đó rất kỳ lạ đang xảy ra. Tất cả đầu ra ntp là hợp lý bình thường và hiển thị đồng bộ hóa tốt. Tuy nhiên, lệnh của bạn để có được thời gian từ thiết bị đã cho một thời gian tắt. Điều đó cho thấy rằng vì một số lý do, thiết bị hết thời gian không đặt đồng hồ hệ thống từ hệ thống con ntp của nó.
David Schwartz

1
Có vẻ như bạn đã tìm thấy một lỗi và có lẽ cách duy nhất để chuyển tiếp là khởi động lại nó và hy vọng nó biến mất hoặc liên hệ với Cisco.
derobert

Câu trả lời:


2

Tôi hơi miễn cưỡng khi đăng bài này như một câu trả lời vì nguyên nhân ban đầu vẫn chưa rõ ràng. Tuy nhiên, vấn đề dường như được giải quyết - ít nhất là trong thời điểm này.


Sau những bình luận của htm11h , tôi quyết định cập nhật firmware. Và thực sự, bây giờ tôi đang chạy với phần sụn mới hơn, đồng hồ dường như khớp đúng thời gian.

Nhưng điều đó có nghĩa là phần sụn mới là giải pháp? Tiếc là không có. Trong lần thử đầu tiên để tải firmware mới, tôi đã quên thay đổi thanh ghi cấu hình vẫn còn trên mặc định của nhà sản xuất. Do đó, lần khởi động lại đầu tiên của tôi đã kết thúc trong cùng một hình ảnh ROM gốc mà bộ định tuyến đã chạy được gần bốn năm (tức là kể từ khi bật nguồn ban đầu). Tuy nhiên, điều này là đủ để đồng hồ thực hiện một điều chỉnh lớn và sau đó giữ đồng bộ. Điều này cho thấy rằng một khởi động lại đơn thuần có thể đã giúp - tạm thời. Đổi lại, điều này có nghĩa là thời gian chính xác hiện được hiển thị với phần sụn mới hơn vẫn có thể trôi đi từ thời gian ntp trong những năm tới. Sẽ mất vài ngày cho đến khi tôi có thể biết được đồng hồ có mất khoảng 5 giây mỗi ngày hay không ...

Để bây giờ, vụ án được đóng lại.


1

Tôi đã thực hiện khá nhiều công việc với dự án NTP Pool từ giữa những năm 90 và chạy một số máy chủ được đồng bộ hóa GPS NTP Stratum-1 tại đây. Như những người khác đã nói bạn cần nhiều hơn 2 máy chủ để có thời gian. Tôi thường sử dụng 4 ở đây vì những lý do được nêu bởi Ron Maupin ở trên. Cũng như được liệt kê, bạn cần chú ý các vòng lặp và thiết lập mọi thứ như máy chủ so với các máy ngang hàng.

Sự trôi dạt thời gian có thể là do một lỗi đã biết trong iOS đã được sửa trong bản cập nhật iOS này, xử lý ntp.drift không bị xóa hoặc cập nhật chính xác và do đó là sự cố trôi. Ngoài ra, 4 NĂM không có khởi động lại hoặc cập nhật phải khiến bạn rơi vào tình trạng bảo mật khá tệ vì các bản cập nhật iOS Security xuất hiện khá thường xuyên.

Đây là một bài viết tuyệt vời về việc thiết lập NTP trên Cisco IOS http://packetlife.net/blog/2011/mar/28/cisco-ios-clocks-and-ntp/

Hy vọng điều này là hữu ích. Vui lòng hỏi nếu bạn có thêm câu hỏi hoặc vấn đề.


0

Tiết lộ đầy đủ: Tôi thỉnh thoảng chỉ loay hoay với các cấu hình chuyển đổi, và tôi không phải là một chuyên gia NTP.

Điều đó nói rằng, tôi đã từng thấy trình nền NTP trên các hệ thống RHEL 5.x (vâng, tôi sẽ quay lại, nhưng bạn đã nói rằng công tắc của bạn có hình ảnh ~ 4 tuổi ...) bị kẹt trong trạng thái "hạnh phúc" , nơi dường như nghĩ rằng nó đã được đồng bộ hóa hoàn hảo nhưng rõ ràng là không. Chúng tôi sẽ sử dụng phiên ClusterSSH để chạy "ngày" trên tất cả các hệ thống và đôi khi sẽ hiển thị khoảng 5 phút trôi giữa các hệ thống. Nếu tôi nhớ lại một cách chính xác, chúng tôi dường như chỉ có thể khắc phục sự cố bằng cách khởi động lại trình nền, và cuối cùng chỉ cần thực hiện khởi động lại dịch vụ mỗi đêm ...

Không phải là một giải pháp lý tưởng, nhưng bạn có thể áp dụng một cách tiếp cận tương tự với công việc định kỳ để kết nối với công tắc và bắt đầu khởi động lại, hoặc bằng cách nào đó "đá" daemon NTP trên công tắc?

Hi vọng điêu nay co ich!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.