Làm cách nào tôi có thể gỡ lỗi sự cố Đình chỉ RAM trên Linux?


15

Tôi hy vọng sẽ nhận được các đề xuất dựa trên kinh nghiệm về cách khắc phục sự cố treo RAM. Lời khuyên cụ thể cho tình huống của tôi (chi tiết bên dưới) sẽ rất tuyệt, nhưng tôi cũng quan tâm đến lời khuyên chung về cách gỡ lỗi các vấn đề như vậy.

Vấn đề:

Thông thường, khi tôi cố gắng tạm dừng máy của mình, nó bị kẹt trong trạng thái "không bị treo nhưng không tỉnh táo". Thường thì màn hình sẽ có màu đen hoàn toàn nhưng đôi khi nó sẽ có thông báo lỗi sau:

GLib-WARNING **: getpwuid_r(): failed due to unknown user id (0) 

Ngoài ra, trạng thái này cũng sẽ được đi kèm với những người hâm mộ đá vào hộp số cao. Cách duy nhất để đưa nó ra khỏi trạng thái này là tắt nguồn máy tính xách tay.

Một số thông tin

$ uname -a
Linux baltar 2.6.35-22-generic #34-Ubuntu SMP Sun Oct 10 09:26:05 UTC 2010 x86_64 GNU/Linux

$ lsb_release -a
Distributor ID:    Ubuntu
Description:    Ubuntu 10.10
Release:    10.10
Codename:    maverick

Tôi đã xem /var/log/dmesg/var/log/pm-suspend.log, nhưng tôi không biết những gì tôi đang tìm kiếm và không có gì nổi bật. Tôi không chắc nó có liên quan hay không, nhưng tôi đã tìm thấy rất nhiều điều sau đây /var/log/kern.log:

EXT4-fs (dm-0): re-mounted. Opts: errors=remount-ro,commit=600

1
Nếu bạn tin rằng bạn đang bị cắn bởi lỗi cụ thể mà tôi đề cập ở đây, vui lòng không đăng câu trả lời "tôi cũng vậy" - vì đó thực sự không phải là câu trả lời. Hãy thoải mái đưa ra câu hỏi này để khuyến khích người khác trả lời nó. Cuối cùng, một câu trả lời tốt sẽ cung cấp không chỉ lời khuyên để giải quyết vấn đề cụ thể này, mà còn là lời khuyên cho việc gỡ lỗi các loại vấn đề này.
Steven D

Đã xóa sau khi làm rõ trên phòng giáo viên. Các thông tin có giá trị tiềm năng duy nhất được No LSB modules are available.hiển thị ngay sau đó lsb_release -a.
Maciej Piechotka

Tôi đã đánh dấu một câu trả lời "làm việc cho tôi", nhưng tôi vẫn nghĩ một câu trả lời "làm thế nào để gỡ lỗi tạm dừng" chung chung sẽ thực sự hữu ích ở đây.
Steven D

Câu trả lời:



6

PM_DEBUG và PM_TRACE rõ ràng là các phương tiện sửa lỗi sâu nhất hiện có. Khi bạn không nhận được gì có ý nghĩa từ nhật ký cấp cao hơn, AFAIK đây là cơ chế duy nhất quay trở lại khi gặp phải triệu chứng "màn hình trống bí ẩn trên sơ yếu lý lịch" đáng sợ. Thông thường, chúng tôi đang xử lý một trình điều khiển thiết bị bị hỏng khá thường xuyên. Bạn cũng có thể xem qua trình điều khiển gỡ lỗi không dây Broadcom brcmsmac của tôi tại kernel bug 34682 để biết những gì các nhà phát triển kernel đề xuất và tìm kiếm.


1

Tôi có nghi ngờ rằng vấn đề có thể là do BIOS không báo cáo chính xác về mức độ thấp mà nó thực sự sử dụng.

Theo mặc định, tùy chọn này có hiệu lực:

memory_corruption_check_size=64K

Bạn có thể thử đặt giá trị đó thành các giá trị lớn hơn để làm cho trình quét tham nhũng bộ nhớ kiểm tra một khối lowmem lớn hơn.

Tìm "memory_corruption_check_size" trong

Vân vân.

Tôi muốn biết những gì bạn tìm thấy, nếu có bất cứ điều gì.


0

Kinh nghiệm của tôi khi làm việc trong lĩnh vực này là trong Windows CE, chứ không phải Linux.

Trong chu kỳ đình chỉ / tiếp tục, HĐH sẽ tắt dần chức năng HĐH, hạn chế khả năng của bạn để có được thông tin đáng tin cậy chính xác về những gì đang diễn ra bằng chức năng của HĐH. Ngoài ra, kết nối giám sát của bạn có thể (ví dụ: nếu sự cố liên quan đến thời gian) làm thay đổi kết quả.

Các công cụ ưu tiên bắt đầu với kết nối trình gỡ lỗi C / C ++ với HĐH ở cấp cao và ở mức rất thấp gửi dữ liệu xuống một cổng nối tiếp / Mã POST hoặc trên trình gỡ lỗi JTAG không tương tự X86 hoặc tương đương. Kết quả cuối cùng là nhiều giờ làm việc với dòng mã và tìm ra điểm khi nó hoạt động khác với hành vi thông thường. Tại thời điểm đó, sửa chữa thường là rõ ràng. Giữ ghi chú tốt, và thực hiện một thay đổi tại một thời điểm.

Phải mất 6 tuần để xác định sự cố tăng sức mạnh mà chúng tôi gặp phải với Windows CE. Chúng tôi đã có một bảng xử lý PC104 mà chúng tôi có thể tắt nguồn trong 10 hoặc 60 giây và không có vấn đề gì. Tuy nhiên, nếu mất điện trong 25 giây, nó sẽ không bật nguồn. Hóa ra chúng ta có đủ điện dung để giữ cho các nội dung DRAM không bị mất điện trong khoảng 20 giây, do đó, trong một chu kỳ tắt nguồn ngắn, Windows CE nghĩ rằng nó đang hoạt động trở lại từ trạng thái treo. Khi tất cả bộ nhớ được bảo tồn, nó thực sự sẽ thực hiện thành công một sơ yếu lý lịch, khi bộ nhớ bị hỏng một phần, nó sẽ trở nên khá bối rối trong quá trình tiếp tục.

Chúc may mắn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.