CPU ProCurve ở mức 100% trong vài phút sau khi khởi động lại


9

Tôi đã thực hiện nâng cấp firmware trong các thiết bị chuyển mạch HP. Hai mô hình khác nhau đã được nâng cấp:

  • ProCurve Switch 5406zl Intelligence Edge (J8697A): được nâng cấp từ K.15.06.0008 lên K.15.12.0012
  • Công tắc HP 2520-24G-PoE (J9299A): được nâng cấp từ J.14.54 lên J.15.09.0021

Kiểm tra từng công tắc ngay sau khi khởi động hình ảnh mới, tôi đã quan sát thấy một cái gì đó:

  1. Các công tắc đã tải hình ảnh phần sụn mới mà không có lỗi và kết nối đã được phục hồi ngay khi công tắc khởi động. Tại thời điểm này, mức sử dụng CPU còn thấp (dưới 10%)
  2. Vài giây sau, việc sử dụng CPU tăng lên 100% và đứng đó trong vài phút. Tôi không thể phát hiện bất kỳ vấn đề nào tại thời điểm này ngoài CLI thông qua SSH hơi chậm chạp: kết nối bình thường, không có thông báo nhật ký ...
  3. Sau năm đến mười phút ở mức 100%, CPU đã trở lại bình thường mà không có bất kỳ thay đổi nào từ phía tôi.

Cả hai mô hình đã có hành vi này. Tôi đã khôi phục một đơn vị của mỗi mô hình cho hình ảnh phần sụn trước đó và chúng đã hoạt động theo cùng một cách.

Mặc dù CPU này tăng đột biến ngay sau khi khởi động không gây ra vấn đề gì, tôi tự hỏi liệu hành vi mạng bình thường có thể là nguyên nhân cho sự tăng đột biến này không, nhưng tôi không nghĩ vậy. Tôi đã xem xét các khía cạnh sau đây:

  1. Ngay sau khi khởi động, STP bắt đầu chạy, tạo BPDU và đạp tất cả các cổng trong chuyển đổi thông qua các trạng thái Bloking, Nghe, Học và Chuyển tiếp. Tuy nhiên, ngay cả với 802.1D, quá trình này không mất hơn 1 phút với bộ định thời mặc định. Hơn nữa, tôi đã kiểm tra các công tắc thông qua SSH, vì vậy tất cả các tính toán STP đã được thực hiện vào thời điểm tôi có thể kết nối với công tắc.

  2. Ngay sau khi khởi động, bảng địa chỉ MAC trống và cần truyền phát cho các khung đầu tiên được chuyển tiếp. Nhưng tôi nghi ngờ việc phát sóng này sẽ mất 100% CPU, ít hơn nhiều trong 5 phút, trong một chuyển đổi 24 cổng.

  3. Tất cả các công tắc hoạt động như các thiết bị L2, không kích hoạt chức năng L3, vì vậy tôi loại bỏ định tuyến và các quy trình L3 khác.

Tôi có thiếu điều gì đó "bình thường" trong các hoạt động mạng có thể giải thích việc sử dụng CPU này trong 5 phút sau khi khởi động lại trong khi vẫn giữ kết nối không? Có lẽ đó là một loại quá trình nền mà công tắc chạy ngay sau khi khởi động lại?

Câu trả lời:


8

Quá trình này mất chưa đến 2 giây trên Google: Cổng thông tin mạng HP

Dòng chuyển đổi HP ProCurve 5400zl - Sử dụng CPU cao (99-100%) sau khi xảy ra sự cố khởi động

Ngay sau khi công tắc được khởi động, mức độ sử dụng CPU cao (99-100%) được quan sát. Giải pháp

Khi công tắc khởi động, một trong những nhiệm vụ khởi tạo là tạo khóa mã hóa. Có các khóa được tạo trước có nghĩa là sau này, khi một tính năng như SSL hoặc SSH sử dụng các khóa được định cấu hình hoặc sử dụng, sẽ có độ trễ tối thiểu trong tính khả dụng. Nhiệm vụ này mất vài giây trước khi tăng tốc, tùy thuộc vào kiểu chuyển đổi, cấu hình được tải và sửa đổi phần mềm. Mặc dù tác vụ tiêu thụ tới 100% CPU, nhưng nó chạy ở mức ưu tiên rất thấp. Do đó, nếu một tác vụ khác yêu cầu chu kỳ CPU được bắt đầu, tác vụ ưu tiên thấp này sẽ tắt. Nếu tác vụ khởi tạo / tạo khóa này chạy không bị gián đoạn bởi các tác vụ ưu tiên cao hơn, sẽ mất khoảng 10 phút để hoàn thành. Nếu CPU bận với các tác vụ khác, thời gian hoàn thành sẽ được kéo dài.

Để xác minh rằng CPU nâng cao đang được nhìn thấy trên thực tế là những gì đã được mô tả ở đây và không phải là thứ gì khác yêu cầu khắc phục sự cố, vui lòng sử dụng các lệnh được ghi dưới đây.

task-monitor cpu (this command was introduced in K.13.04)

show uptime

show cpu

Đầu ra sẽ trông như sau.

Chuyển # cpu giám sát tác vụ Chuyển đổi # hiển thị thời gian hoạt động 0000: 00: 01: 42.36 Chuyển đổi # hiển thị cpu

99 percent busy, from 27 sec ago
1 sec ave: 100 percent busy
5 sec ave: 100 percent busy
1 min ave: 66 percent busy

Task usage for last 5 sec
 % CPU | Description
-------+--------------------------
   0.3 | Sessions & I/O
  99.7 | System Services

Tôi đồng ý điều này dường như để mô tả vấn đề tôi đã trải qua. Nhưng rồi một câu hỏi mới xuất hiện trong đầu tôi. Như tôi đã nói, tôi đã kiểm tra các thiết bị chuyển mạch thông qua kết nối SSH. Nếu các khóa SSH được tạo vài giây sau khi tôi đăng nhập: làm thế nào tôi có thể bắt đầu phiên SSH trước khi các khóa sẵn sàng?
Daniel Yuste Aroca

2
Từ Hướng dẫn bảo mật truy cập Procurve: Khi bạn tạo cặp khóa máy chủ trên công tắc, công tắc sẽ đặt cặp khóa đó vào bộ nhớ flash (chứ không phải trong tệp cấu hình đang chạy). Ngoài ra, công tắc duy trì cặp chìa khóa trong suốt quá trình khởi động lại, bao gồm cả chu kỳ nguồn. Xóa (zeroing) cặp khóa công khai / riêng của công tắc sẽ khiến công tắc không thể tham gia vào hoạt động SSH và tự động vô hiệu hóa IP SSH trên công tắc.
Daniel Yuste Aroca
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.