Tôi đã nhận được e-mail từ một người dùng lo lắng rằng các lỗi sau trên một trong các máy chủ của anh ta là dấu hiệu của một vấn đề nghiêm trọng. Vấn đề là, những lỗi dưới đây là tất cả những gì tôi phải tiếp tục. Tôi thường coi mình là một nhân viên Google tốt, nhưng trong trường hợp này tôi chỉ có thể tìm thấy một sự cố khác trong đó người dùng gặp phải lỗi này liên quan đến "thư mục Bộ lọc thăm dò":
[1044 snapshots @ abc]$
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: CPU:0
MC4_STATUS[Over|CE|MiscV|-|AddrV|-|Poison|CECC]: 0xdc0248d0001f010b
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: MC4_ADDR: 0x0000000000010f40
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: Northbridge Error (node 0): ECC Error in the
Probe Filter directory.
Message from syslogd@abc at Sep 8 02:51:51 ...
kernel:[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: GEN
Từ những gì tôi có thể nói, điều này chỉ xảy ra một lần. Xoay quanh các bản ghi cho các lỗi phần cứng khác không có gì khác ngoài sự cố này.
Bài đăng trên diễn đàn mà tôi tham khảo ở trên chỉ đơn giản kết thúc bằng việc nói với người dùng rằng đừng lo lắng về nó nếu nó chỉ xảy ra một lần và không gây ra bất kỳ vấn đề nghiêm trọng nào. Đây là lời khuyên tương tự mà tôi nhận được từ các đồng nghiệp của mình, người cũng đã đề cập rằng có quá nhiều biến số (tức là những gì đã chạy vào lúc 2:50 sáng ngày 8 tháng 9?).
Tuy nhiên, người dùng này muốn được đảm bảo rằng có gì đó không ổn với hệ thống của họ. Những lỗi trên có thể chỉ ra hoặc có liên quan đến điều gì? "Thư mục bộ lọc thăm dò là gì?" Những thử nghiệm nào tôi có thể chạy để giúp người dùng thoải mái rằng điều này không gắn cờ cho máy của họ sắp xảy ra?
Bản phân phối Linux của máy là Red Hat Enterprise Linux Server phát hành 6.4 (Santiago).