eth0 NIC Link đang lặp lại thông báo trong nhật ký kernel


14

Tôi đã nhận thấy từ vài ngày trước rằng loại tin nhắn lặp lại tương tự xảy ra và tôi có thể nói tích cực rằng không có gì được cố ý thay đổi (cài đặt / gỡ cài đặt) trong khoảng thời gian đó.

đây là mẫu của tin nhắn /var/log/kern.log :

Mar 30 06:32:45 aurora kernel: [566322.867110] e1000e: eth0 NIC Link is Down

Mar 30 06:32:47 aurora kernel: [566325.313634] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

Mar 30 06:32:59 aurora kernel: [566337.632930] e1000e: eth0 NIC Link is Down

Mar 30 06:33:18 aurora kernel: [566356.543664] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: None

Mar 30 11:05:47 aurora kernel: [582689.779752] e1000e: eth0 NIC Link is Down

Mar 30 11:05:50 aurora kernel: [582692.174337] e1000e: eth0 NIC Link is Up 1000 Mbps Full Duplex, Flow Control: Rx/Tx

từ tệp nhật ký hoàn chỉnh - khi tính tất cả thông điệp nhật ký loại này - tôi có thể kết luận:

  • eth0 thất bại cứ sau vài giờ
  • eth0 thất bại trong trường hợp đầu tiên trong hai và thứ hai trong 19 giây

Đó là máy chủ sản xuất tôi đang nói ở đây.

Làm thế nào để giải quyết vấn đề này, vì máy chủ thư đang trong quá trình sản xuất và lỗi mạng trong thời gian 19 giây tôi không thể chịu đựng được?


1
Những gì bạn đã kiểm tra cho đến nay? Là cáp được gắn đúng cách và trong tình trạng không hề hấn gì? Có phải công tắc ở đầu bên kia cũng quan sát các liên kết đi xuống? Đáng lưu ý là liên kết được phát hiện khác nhau ở các thời điểm khác nhau (điều khiển luồng khác nhau trong nhật ký của bạn). Có lẽ việc autonegotiation thất bại? Vấn đề có biến mất nếu bạn buộc 1000 Rb / Tx 1000Mbps không?
Håkan Lindqvist

@ HåkanLindqvist Tôi không có tùy chọn để kiểm tra cáp, vì máy chủ không ở gần tôi. Có phải đó là điều tôi nên yêu cầu công cụ máy chủ nông trại kiểm tra? Làm cách nào để buộc 1000 Rb / Tx 1000Mbps? Và, về kiểm soát dòng chảy là khác nhau tại các thời điểm khác nhau, là vấn đề này?
Miloš Đakonović

Liên kết "loại" thay đổi theo thời gian gợi ý cho tôi rằng có điều gì đó không hoàn toàn đúng nhưng việc tìm ra nguyên nhân thực sự dĩ nhiên là một câu hỏi hoàn toàn riêng biệt. Hỏi nhân viên công nghệ có thể là một ý tưởng tốt.
Håkan Lindqvist

1
Bạn có thể sử dụng ethtool hoặc mii-tool để kiểm tra trạng thái tự động đàm phán, vv ở cuối máy chủ. Bạn cần đảm bảo rằng công tắc máy chủ của bạn được thiết lập để khớp. Điều này có vẻ như một vấn đề phần cứng - có thể là bộ điều hợp máy chủ, cáp hoặc chuyển đổi. Tôi đề nghị nhìn vào trạng thái của công tắc để xem những gì nó nghĩ đang xảy ra.
Paul Haldane

Câu trả lời:


10
  1. kiểm tra lỗi trên dây, xem trường "lỗi" ở đầu ra của ifconfig. Nếu khác không thì có vấn đề với phần cứng (cáp, thẻ NIC hoặc hub / switch). Một cáp Ethernet không đáng tin cậy cũng sẽ có lỗi trong lĩnh vực này.
  2. thay thế cáp Ethernet, bất kể bước 1. Điều này nhanh chóng, rẻ tiền và dễ dàng và nên được thực hiện bất cứ khi nào liên kết của bạn lên xuống theo các khoảng thời gian ngẫu nhiên.
  3. sử dụng ethtoolvà đảm bảo các cài đặt mạng (song công, v.v.) khớp với các cài đặt trên công tắc. Nếu bạn không phải là quản trị viên của công tắc, hãy yêu cầu quản trị viên mạng cung cấp cho bạn các cài đặt.
  4. nếu công tắc có bật điều khiển luồng, thì hãy chắc chắn rằng nó được bật trên hộp Linux của bạn. Nếu không, vô hiệu hóa nó.

Là một lưu ý phụ, bạn nên đánh giá xem bạn có cần kiểm soát dòng chảy hay không. Theo HP, chỉ cần thiết cho các ứng dụng hiệu suất cao: xem bài viết của HP về Khi nào nên sử dụng Điều khiển luồng


1
Đó là lỗi dây. Công cụ máy chủ nông trại đã thực hiện công việc sau khi tôi báo cáo lỗi.
Miloš Đakonović

1
'ifconfig' đã hiển thị lỗi?
Michael Martinez

1

Đây là sửa chữa của tôi. Sự cố này xảy ra trên phần cứng cụ thể (trên một máy chỉ có 1 trong 2 cổng trên NIC), luôn luôn có trình điều khiển e1000e, kể từ kernel 3.9 trở lên. Tập tin này là dành cho centos7, đi vào /etc/init.d/và phải được bật với chkconfig --add <name>. Tên giao diện được mã hóa cứng ... hãy chắc chắn để đặt nó.

#!/bin/sh

### BEGIN INIT INFO
# Provides:          pm-e1000e-fix
# Required-Start:    $network
# Required-Stop:     $network
# Default-Start:     2 3 4 5
# Default-Stop:      0 6
# Short-Description: workaround for e1000e issue
# Description:       e1000e fix
### END INIT INFO

################################################################################
# Give Usage Information                                                       #
################################################################################
usage() {
    echo "Usage: $0 start|restart" >&2
    exit 1
}

################################################################################
# E X E C U T I O N    B E G I N S   H E R E                                   #
################################################################################
command="$1"
shift

interface="eth0"

case "$command" in
    start)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    restart)
        ethtool -K "$interface" gso off gro off tso off
        ;;
    *)
        usage
        ;;
esac
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.