Trong tuần qua, máy chủ của tôi (chạy Debian Jessie) đã khởi động lại hai lần. Trong nhật ký hệ thống, tôi thấy điều này trước mỗi lần khởi động lại và không có điểm nào khác:
Aug 15 13:32:58 hoshimiya kernel: [296512.005355] {1}[Hardware Error]: Hardware error from APEI Generic Hardware Error Source: 1
Aug 15 13:32:58 hoshimiya kernel: [296512.005360] {1}[Hardware Error]: It has been corrected by h/w and requires no further action
Aug 15 13:32:58 hoshimiya kernel: [296512.005361] {1}[Hardware Error]: event severity: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005362] {1}[Hardware Error]: Error 0, type: corrected
Aug 15 13:32:58 hoshimiya kernel: [296512.005363] {1}[Hardware Error]: fru_text: CorrectedErr
Aug 15 13:32:58 hoshimiya kernel: [296512.005364] {1}[Hardware Error]: section_type: memory error
Aug 15 13:32:58 hoshimiya kernel: [296512.005365] [Firmware Warn]: error section length is too small
Một số googling khiến tôi tin rằng điều này là để làm với RAM ECC của tôi phát hiện và phục hồi từ một lỗi. Điều này có đúng không? Nếu nó đang phục hồi, tại sao hệ thống khởi động lại? Tôi muốn ngăn hệ thống khởi động lại, nếu có thể.