Lỗi Northbridge Bridge (nút 0): Lỗi ECC trong thư mục Bộ lọc thăm dò


8

Tôi đã nhận được e-mail từ một người dùng lo lắng rằng các lỗi sau trên một trong các máy chủ của anh ta là dấu hiệu của một vấn đề nghiêm trọng. Vấn đề là, những lỗi dưới đây là tất cả những gì tôi phải tiếp tục. Tôi thường coi mình là một nhân viên Google tốt, nhưng trong trường hợp này tôi chỉ có thể tìm thấy một sự cố khác trong đó người dùng gặp phải lỗi này liên quan đến "thư mục Bộ lọc thăm dò":

[1044 snapshots @ abc]$
Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: CPU:0 
MC4_STATUS[Over|CE|MiscV|-|AddrV|-|Poison|CECC]: 0xdc0248d0001f010b

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]:       MC4_ADDR: 0x0000000000010f40

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: Northbridge Error (node 0): ECC Error in the 
Probe Filter directory.

Message from syslogd@abc at Sep  8 02:51:51 ...
  kernel:[Hardware Error]: cache level: L3/GEN, tx: GEN, mem-tx: GEN

Từ những gì tôi có thể nói, điều này chỉ xảy ra một lần. Xoay quanh các bản ghi cho các lỗi phần cứng khác không có gì khác ngoài sự cố này.

Bài đăng trên diễn đàn mà tôi tham khảo ở trên chỉ đơn giản kết thúc bằng việc nói với người dùng rằng đừng lo lắng về nó nếu nó chỉ xảy ra một lần và không gây ra bất kỳ vấn đề nghiêm trọng nào. Đây là lời khuyên tương tự mà tôi nhận được từ các đồng nghiệp của mình, người cũng đã đề cập rằng có quá nhiều biến số (tức là những gì đã chạy vào lúc 2:50 sáng ngày 8 tháng 9?).

Tuy nhiên, người dùng này muốn được đảm bảo rằng có gì đó không ổn với hệ thống của họ. Những lỗi trên có thể chỉ ra hoặc có liên quan đến điều gì? "Thư mục bộ lọc thăm dò là gì?" Những thử nghiệm nào tôi có thể chạy để giúp người dùng thoải mái rằng điều này không gắn cờ cho máy của họ sắp xảy ra?

Bản phân phối Linux của máy là Red Hat Enterprise Linux Server phát hành 6.4 (Santiago).


Điều này giải thích nó là gì: developer.amd.com/community/blog/ht-assist-what-is-it
derobert

Whoa, bạn nói đúng! Tôi ctrl + f'd trang và tìm thấy "Hỗ trợ HT hoặc Bộ lọc thăm dò như đôi khi nó được gọi." Cuối cùng một số loại tham chiếu đến lỗi / điểm bắt đầu! Tôi có nhiều việc phải đọc :)
CptSupermrkt

@derobert nghe có vẻ như một câu trả lời, phải không?
Braiam

@Braiam liên kết đó chỉ giải thích "bộ lọc thăm dò" là gì ... nó không giải thích tại sao OP sẽ gặp lỗi ECC ở đó hoặc nếu nó chỉ ra một vấn đề thực sự.
derobert

Câu trả lời:


1

Tôi không có câu trả lời chính xác, nhưng một số trong số này là quen thuộc. Tôi không biết thư mục Bộ lọc thăm dò là gì, nhưng CptSupermrkt đã giải thích điều đó ở trên.

Trong PCI, Northbridge kết nối với bộ nhớ và bộ xử lý. Lỗi ECC được liên kết với DRAM. Có các bit Mã sửa lỗi được lưu trữ cùng với mỗi từ. Khi đọc chúng được kiểm tra trên ghi chúng được cập nhật. Lỗi ECC có thể sửa hoặc không sửa được, điều này cho thấy khả năng sửa lỗi bằng cách sử dụng các bit được ghi. Không thể sửa chữa không chỉ ra rằng có một lỗi phần cứng vĩnh viễn. Những điều này có thể xảy ra khi DRAM bắt đầu thất bại.

Với tất cả điều đó, điều này trông giống như một lỗi thoáng qua. Bạn có thể thử kiểm tra bộ nhớ hoàn chỉnh, nhưng không có khả năng tìm thấy gì. Nếu DRAM không thành công, hành động khắc phục duy nhất của bạn là thay thế nó.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.