Làm thế nào để chẩn đoán đóng băng ngẫu nhiên?


14

Ubuntu dường như luôn đóng băng trong ~ 15 phút đầu tiên khi nó khởi động trên máy của tôi. Đôi khi chỉ trong 5 phút đầu tiên, đôi khi phải mất 30 phút, đôi khi điều đó không bao giờ xảy ra ...

Tôi không thể tái tạo nó một cách dứt khoát, nhưng dù sao nó cũng có thể xảy ra đủ để tôi có thể chờ nó xảy ra lần nữa.

Làm thế nào tôi có thể chẩn đoán đóng băng để tìm ra nguyên nhân ?

Lưu ý cho những người bỏ phiếu gần:
Không, đây không phải là một bản sao của câu hỏi này . Câu hỏi này là về chẩn đoán , không phải là một sự phục hồi tạm thời. Các câu trả lời cho câu hỏi đó chỉ cho tôi biết cách giết X Server, sử dụng Magic Combo để thiết lập lại kernel, v.v .... điều đó không giúp tôi tìm ra nguyên nhân.

Một số thông tin:

  1. Ubuntu 11.04: 2.6,38-15 chung # 66-Ubuntu SMP x86_64 GNU / Linux

  2. Chuột đôi khi di chuyển xung quanh, nhưng UI không bao giờ phản hồi.

  3. Nhấn Ctrl+ Alt+ F1để vào thiết bị đầu cuối không hoạt động.

  4. Các Alt+ SysRqcombo làm việc ... và dường như là điều duy nhất mà làm việc, ngoài chuột (mà đôi khi cũng có thể di chuyển xung quanh).

  5. Tôi không dùng hết tài nguyên (nhiều GB RAM và dung lượng hệ thống tệp là miễn phí)

  6. Phần cứng có thể có liên quan (từ ứng dụng Phần cứng Lister):

    • Bộ điều hợp mạng không dây AR9285 (PCI-Express)

    • GT216 [GeForce GT 330M] (Tôi đang sử dụng trình điều khiển Nouveau, có vẻ như hoạt động tốt)


đã thấy một nhận xét ở nơi khác về việc cố gắng ssh vào máy của bạn từ một máy khác - thành công / thất bại ít nhất cho thấy mức độ nghiêm trọng của sự đóng băng - câu hỏi tuyệt vời!
david.libremone

Câu trả lời:


7

Các bản ghi phải luôn là cổng đầu tiên của bạn. Kiểm tra syslog cho bất cứ điều gì không mong muốn:

less /var/log/syslog

Đồng thời kiểm tra nhật ký Xserver trong trường hợp có bất kỳ dấu hiệu nào của sự cố trình điều khiển đồ họa (mặc dù điều đó nghe có vẻ ít được đưa ra mô tả của bạn):

less /var/log/Xorg.0.log

Trong trường hợp cụ thể của bạn, các bước này có thể không đưa ra bất cứ điều gì thú vị. Trong trường hợp đó, tôi rất muốn xem những gì đang xảy ra trên hệ thống của bạn tại thời điểm xảy ra sự cố. Cuối cùng, cá nhân tôi đã thiết lập một nhật ký topđầu ra tạm thời trong khoảng thời gian ngắn - cứ sau 5 hoặc 10 giây. Điều này hy vọng sẽ tiết lộ nếu một quy trình đang hoạt động mạnh mẽ với các tài nguyên tại thời điểm xảy ra sự cố.

Lưu ý rằng các lựa chọn thay thế tồn tại, chẳng hạn như chuyển sang một tty khác với Ctrl+Alt+F1.. F6(để quay lại GUI, nó Ctrl+Alt+F7) và chạy các lệnh tương tác hoặc định cấu hình máy chủ SSH và đăng nhập từ xa. Cả hai điều này có thể gây khó xử nếu máy của bạn không phản hồi, do đó tôi đề nghị viết một logfile (điều này cũng có thể gặp phải vấn đề tương tự, nhưng có nhiều khả năng thành công hơn).

Nó sẽ liên quan đến một cái gì đó như thế này:

while [ 1 -eq 1 ] ; do top -b >> ~/top.log; sleep 10; done

Điều này sẽ ghi topđầu ra vào một logfile tại ~ / top.log cứ sau 10 giây hoặc lâu hơn. Lưu ý rằng nhật ký này sẽ phát triển khá lớn nếu lệnh này được chạy trong một thời gian dài, vì vậy hãy theo dõi nó nếu máy của bạn đột nhiên bắt đầu hoạt động! Và xóa nhật ký rm ~/top.logkhi bạn hoàn thành nó. Cũng lưu ý rằng việc thực hiện lệnh trên là việc một lần; nó sẽ không tự khởi động lại sau khi khởi động lại.

Để đọc nhật ký được tạo sau sự cố, bạn sẽ sử dụng

less ~/top.log

và nhấn Endphím để xuống đáy. Bạn sẽ tìm kiếm các quy trình có giá trị CPU cao bất thường hoặc giá trị RES cao bất thường.

Nó có thể hoặc không thể giúp đỡ, nhưng đó là thông tin hữu ích để có.


À cảm ơn. Tôi chỉ tìm kiếm /var/log/messagesnhưng nó không tồn tại ... đó là một tập tin thực sự hay bạn có ý định tôi nên xem nhật ký trong thư mục đó? (Nếu vậy, nhật ký nào?)
user541686

Tôi xin lỗi, tôi đang nghĩ đến các bản phân phối khác. Tất cả đều khác biệt! Trên Ubuntu tương đương là / var / log / syslog. Tôi sẽ cập nhật câu trả lời.
IlluminAce

Ah không phải lo lắng, cảm ơn. :) Tôi chỉ nhìn vào syslogkern.log, và trong cả hai thứ đó, tôi đã tìm kiếm SysRq(vì điều đầu tiên tôi làm là làm sạch hệ thống tập tin) ... nhưng dường như không có gì liên quan xảy ra trước khi xả, theo nhật ký. Hãy để tôi kiểm tra nhật ký xorg ...
user541686

Hmm, dường như không có gì nổi bật trong Xorgnhật ký. Ngoài ra, đây chắc chắn không phải là vấn đề về CPU (đó là lý do tại sao tôi đã đề cập đến việc nó không thiếu tài nguyên), CPU của tôi hầu như không được sử dụng trong suốt quá trình đóng băng. Việc đóng băng là hoàn toàn ngẫu nhiên ... đôi khi tôi kéo một cửa sổ và nó đóng băng, đôi khi tôi chỉ để máy tính ở đó trong năm phút và khi tôi quay lại thì nó bị đóng băng. Nhưng nó hoàn toàn không liên quan đến việc thiếu tài nguyên. Tuy nhiên, thông tin tốt, cảm ơn.
dùng541686

Tôi nên đề cập rằng có một sự cảnh báo nhỏ đối với nhật ký Xorg, trong đó bạn có thể thấy dữ liệu từ phiên trước đó đã bị ghi đè bởi phiên mới mà bạn đang tham gia. Nếu đó là trường hợp, bạn có thể xem dữ liệu gốc bằng cách khởi động thẳng đến một tty (sau khi gặp sự cố ...) và kiểm tra nhật ký ở đó. Bạn có thể khởi động trực tiếp vào thiết bị đầu cuối bằng cách thêm "văn bản" vào cuối dòng khởi động kernel - như được mô tả ở đây: askubfox.com/questions/158382/ Khăn Khi bạn hoàn tất, hãy khởi động lại hoặc nhập X với dịch vụ sudo bắt đầu lightdm, hoặc startx trực tiếp
IlluminAce 17/1/13
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.