Làm cách nào để khắc phục sự cố đóng băng ngẫu nhiên, trong đó hệ thống không chấp nhận bất kỳ đầu vào nào?
Tôi có một máy tính đã từng chạy Ubuntu vài năm trước mà không gặp vấn đề gì (tôi không biết có phần cứng nào đã thay đổi không). Gần đây, cho dù tôi cài đặt bản phân phối Linux nào, nó sẽ đóng băng ngẫu nhiên đến một điểm mà con trỏ bị đóng băng và nó không phản hồi với bất kỳ đầu vào bàn phím nào, kể cả alt + sysrq (khi hệ thống không bị đóng băng, tôi có thể alt + sysrq REISUB và nó sẽ khởi động lại). Không có câu trả lời trong Tôi nên làm gì khi Ubuntu đóng băng? có vẻ như 'làm việc' trong tình huống này.
Tôi đã kích hoạt đóng băng với các hệ thống sau: Ubuntu 12.04, Ubuntu 14.04, Ubuntu 14.10, Ubuntu 15.04, Ubuntu 15.10, cũng như Fedora 22 và 23 (tất cả các phiên bản 64 bit). Nó xảy ra với XFCE, Unity và thậm chí Gnome, nó xảy ra với nouveau và các phiên bản khác nhau của trình điều khiển nvidia độc quyền. Nó có thể đóng băng ngay cả trong khi cài đặt, hoặc trong một phiên trực tiếp. Đôi khi hệ thống sẽ chạy trong 5 phút trước khi đóng băng và đôi khi hai giờ. Phần cứng tương tự có thể chạy hệ điều hành Windows trong nhiều ngày mà không gặp sự cố.
Tôi đã thử thiết lập Kernel Crash Dump, nhưng dường như nó không kích hoạt khi hệ thống đóng băng. Không có mục nào trong syslog hoặc kern.log dường như đã được viết ngay trước khi đóng băng. Trên một số đóng băng, mục cuối cùng trong syslog hoặc kern.log là 30 phút trước đó.
Cập nhật: Tôi đã ngắt kết nối card mạng không dây cũng như webcam USB, sẽ cho phép máy chạy qua đêm để xem liệu một trong số đó có gây ra lỗi không. Sẽ cập nhật với kết quả.
Cập nhật 2: Nó đóng băng một lần nữa. Tôi thực sự hết ý tưởng. Mọi góp ý đều được chào đón.
Update3: Một số thông số kỹ thuật phần cứng có thể có liên quan:
Bo mạch chủ: Sabertooth 990FX R2.0
CPU: AMD FX-8350 Phiên bản màu đen
GPU: GeForce GTX 660
Cập nhật 3:
Gần đây tôi đã nâng cấp bios của Sabertooth 990FX R2.0 lên Phiên bản 2501 (phiên bản mới nhất hiện có), mà không gặp may mắn.
Cập nhật 4:
Tôi đã chạy một memtest trong 9 giờ, nhiều lần vượt qua và không một lỗi nào. Có hai DIMMS ngồi ở khe 2 và 4 trên bo mạch chủ. Bây giờ tôi đã thử loại bỏ cái này khỏi khe 4 và sẽ xem liệu tôi có thể tái tạo việc đóng băng không. Sẽ trao đổi chúng xung quanh sau đó.
Cập nhật 5:
Nó đã chạy trong nhiều giờ mà không bị đóng băng cho đến nay, tôi cảm thấy khó tin bản thân mình. Nó có thể được giải quyết, nhưng tôi không hiểu tại sao. Tôi đoán tôi sẽ thử và cho nó một vài ngày để chắc chắn.
Cập nhật 6:
Không có đóng băng, và tôi phải kết luận rằng chúng là do bộ nhớ bị lỗi. Vì memtest không hiển thị bất kỳ lỗi nào, nên có thể tôi sẽ không bao giờ tìm ra điều gì sai nếu tôi không bắt đầu ngắt kết nối các phần 'ngẫu nhiên'. Đây có phải là cách tiếp cận tốt nhất thực sự? Nếu ai đó có thể viết ra một cách có hệ thống hơn để thực hiện điều gì đó như thế này, có lẽ với việc khắc phục sự cố từ bên trong Ubuntu, tôi sẽ trao thưởng cho họ tiền thưởng.