Làm thế nào để điều tra nguyên nhân của tổng treo?


19

Máy Arch của tôi đôi khi bị treo, đột nhiên không phản hồi theo bất kỳ cách nào với chuột hoặc bàn phím. Con trỏ bị đóng băng. Ctrl-Alt-Backsp sẽ không dừng X11 và ctrl-alt-del hoàn toàn không làm gì cả. Các sơ đồ hoạt động của cpu, mạng và đĩa trong conky và icewm ngừng cập nhật. Trong vài phút quạt bật. Cách duy nhất để làm cho máy tính làm bất cứ điều gì là tắt nguồn.

Khi khởi động, màn hình nhiệt độ CPU hiển thị 70 đến 80C. Trước khi bị treo, tôi thường thực hiện các hoạt động cường độ thấp như lướt web khoảng 50C.

Các bản ghi cho thấy không có gì đặc biệt so với tắt máy bình thường. Bộ kiểm tra bộ nhớ chạy tốt với các khuyết tật bằng không.

Làm thế nào tôi có thể điều tra tại sao nó treo lên? Có thêm thông tin tôi có thể tìm thấy cho một đầu mối? Có bất cứ điều gì ít quyết liệt hơn tắt nguồn để có được một số hành động, nếu chỉ một số vỏ hạn chế hoặc chỉ là tiếng bíp, nhưng có thể đưa ra một manh mối?

Máy là máy tính xách tay Gateway P6860 17 "(cồng kềnh nhưng mạnh mẽ) và nó đang chạy Arch 64bit, tính đến thời điểm hiện tại (kể từ tháng 3 năm 2011). Tôi đã gặp Arch trong một thời gian dài, đã chuyển sang Ubuntu khoảng một tuần sau đó rút lui về một bản cài đặt mới của Arch. Đó là khi việc treo cổ bắt đầu.

CẬP NHẬT: Vâng, chắc chắn là nó quá nóng. Ở một nhiệt độ, chuột và bàn phím ngừng hoạt động, đôi khi hoạt động sau vài phút làm mát. Ở nhiệt độ cao hơn, những điều tồi tệ hơn xảy ra, như hoàn toàn không phản ứng bao gồm cả việc bỏ qua SysRq. Tình trạng này ngay sau đó là mất điện đột ngột. Tôi đã giải quyết vấn đề bằng cách mua một máy tính mới 8D

Câu trả lời:


7

Câu trả lời của Frederik liên quan đến phép thuật SysRq và các bãi chứa hạt nhân sẽ hoạt động nếu kernel vẫn đang chạy và không thực sự bị treo. Hạt nhân có thể chỉ bận rộn vì một số lý do.

Thực tế là nó không phản hồi với Ctrl-Alt-Del cho tôi biết rằng có lẽ không phải vậy và máy đang bị khóa cứng. Điều đó có nghĩa là lỗi phần cứng, hoặc một cái gì đó liên quan chặt chẽ, như một trình điều khiển xấu.

Kiểm tra kiểm tra bộ nhớ của bạn là tốt, nếu bạn để nó chạy đủ lâu. Bạn cũng nên thử những thứ khác để thử và nhấn mạnh hệ thống, như StressLinux . Điểm chuẩn dài hạn là tốt, quá.

Một điều khác để thử là khởi động hệ thống bằng đĩa CD trực tiếp Ubuntu và cố gắng sử dụng hệ thống như bình thường. Nếu việc quay lại Ubuntu tạm thời như vậy không gây ra sự cố tái diễn, rất có thể nó không thực sự bị hỏng phần cứng, mà là một trong những điều liên quan như trình điều khiển xấu hoặc kernel được cấu hình không chính xác. Hoàn toàn có khả năng một bản phân phối phổ biến hơn như Ubuntu có thể có cấu hình kernel ổn định hơn so với Arch, đơn giản là do số lượng máy lớn hơn mà nó đã được thử trong giai đoạn thử nghiệm của bản phân phối.


Tôi tin rằng Ctrl-Alt-Delete được xử lý bởi init nên nó có thể không hoạt động ngay cả khi kernel vẫn hoạt động. OTOH AFAIR hạt nhân không chờ đợi các khóa SysRq sau khi hoảng loạn.
jpc

1
Điều đó là khả thi. Để phân biệt các trường hợp, đặt ctrlaltdel hardtrong /etc/rc.localtập tin của bạn . Khi hệ thống khóa, hãy thử Ctrl-Alt-Del. Nếu nó vẫn không làm gì, bạn biết chắc rằng kernel không còn chạy nữa; bạn có một lỗi phần cứng hoặc trình điều khiển.
Warren Young

1
Tôi đã có nhân trả lời các phím Magic SysRq mặc dù nó đã bị hoảng loạn. Thiết lập đúng dịch vụ kdump phải đảm bảo rằng một hệ thống được nêm hoàn toàn khởi động vào kernel kdump, vì vậy cuối cùng nó sẽ quay trở lại.
jsbillings

1
Sau khi lướt nhanh qua mã xử lý bàn phím kernel, có vẻ như tôi như Ctrl-Alt-Del và phép thuật SysRq được xử lý ở cùng cấp độ: nếu một cái hoạt động, cái kia sẽ hoạt động. Vấn đề init (1) / SIGINT là riêng biệt và được xử lý bằng cách đặt xử lý Ctrl-Alt-Del để thực hiện khởi động lại cứng, như đã đề cập trong nhận xét khác của tôi.
Warren Young

11

Về việc đóng băng, có một vài lựa chọn:

  • sử dụng cổng nối tiếp nếu hộp của bạn có một cái để lấy kết xuất ở đó bằng cách thêm console=ttyS0vào các tùy chọn khởi động, như được mô tả ở đây . Bạn cần một máy thứ hai có cổng nối tiếp và cáp modem null để bắt tệp kết xuất.

  • sử dụng netconsole để có được kết xuất qua mạng, xem tại đây .

  • Sử dụng kexec / kdump theo cách này bạn có được một bãi chứa cục bộ, xem tại đây .

Liên quan đến vấn đề tắt nguồn sạch, tôi khuyên bạn nên sử dụng phím SysRq ma thuật để 'Đồng bộ hóa các đĩa', hãy kết nối chúng và sau đó chọn lại hộp (các chữ cái là những chữ bạn nên gõ cùng với alt -sysrq.

Chỉnh sửa: Nếu bạn đăng oops / dấu vết lên lkml, bạn nên sử dụng phiên bản mới nhất (tốt nhất là mới nhất) của kernel và không có mô-đun độc quyền.


1
Tôi có thể tưởng tượng rất nhiều giọng nói trẻ nói rằng "Cổng nối tiếp là gì, thưa ông?" Trong thực tế, tôi không nghĩ rằng máy này thậm chí có một.
DarenW

Tôi nhớ đã đọc một cái gì đó về SysReq vài năm trước. Giá như tôi có thể google nó khi máy chết! Đoán tôi tốt hơn nên bận rộn thiết lập một máy thứ hai ...
DarenW
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.