Là ổ đĩa này thất bại hay cái gì khác?


12

Tôi có một ổ đĩa năm tuổi gây rắc rối cho tôi. Sao chép dữ liệu vào nó không thành công sau khoảng 8-10GB chuyển. Nó tự nhiên thay đổi thành 'chỉ đọc'. Nó được định dạng đúng ext4, tôi là chủ sở hữu. Tìm kiếm trực tuyến, có vẻ như đây là một triệu chứng của một ổ đĩa bị lỗi.

Làm cách nào để xác nhận điều này, vì các xét nghiệm SMART chỉ ra cách khác?

Tôi đã làm điều hiển nhiên như kiểm tra Disk Utility và chạy thử nghiệm SMART mở rộng. Tất cả các kết quả từ Disk Utility trở lại hoàn hảo. Đọc tỷ lệ lỗi và các lĩnh vực được phân bổ lại đang hiển thị bằng không.

Tôi đoán đĩa này là xấu và SMART không phát hiện ra, mặc dù tôi không hiểu tại sao. Tôi muốn xác nhận vấn đề là gì.

Tôi không gặp vấn đề với các đĩa khác trong máy.

fstab:

proc / proc proc nodev, noexec, nosuid 0 0 UUID = 62e11126-3f06-43f0-bd5a-29b411bb8160 / ext4
errors = remount-ro 0 1
UUID = 5e2d6348-be6e-4d5d-8f7f-1a5c1cab7db2 / home ext4
giá trị mặc định 0 2 UUID = 97e594a3-c783-4c73-97c0-682afcdc88b6 không có trao đổi sw 0 0
/ dev / đĩa / by-nhãn / Media / media / Media ntfs-3g mặc định, người dùng, locale = en_GB.utf8 0 0

Đầu ra của dmesg | less: (Có hàng trăm dòng 'Lỗi I / O bộ đệm' ở trên)

[22734.511487] Buffer I/O error on device sda1, logical block 302203
[22734.511489] Buffer I/O error on device sda1, logical block 302204
[22734.511490] Buffer I/O error on device sda1, logical block 302205
[22734.511492] Buffer I/O error on device sda1, logical block 302206
[22734.511494] Buffer I/O error on device sda1, logical block 302207
[22734.511496] EXT4-fs warning (device sda1): ext4_end_bio:251: I/O error writing to inode 9437465 (offset 4194304 size 524288 starting block 302215)
[22734.511500] ata1: EH complete
[22734.511616] EXT4-fs error (device sda1): ext4_journal_start_sb:327: Detected aborted journal
[22734.511619] EXT4-fs (sda1): Remounting filesystem read-only
[22734.519343] EXT4-fs error (device sda1) in ext4_da_writepages:2298: IO failure
[22734.538566] EXT4-fs (sda1): ext4_da_writepages: jbd2_start: 601 pages, ino 9437474; err -30
[22734.560225] ata1.00: exception Emask 0x10 SAct 0x1 SErr 0x400100 action 0x6 frozen
[22734.560253] ata1.00: irq_stat 0x08000000, interface fatal error
[22734.560256] ata1: SError: { UnrecovData Handshk }
[22734.560258] ata1.00: failed command: WRITE FPDMA QUEUED
[22734.560262] ata1.00: cmd 61/00:00:3f:68:25/04:00:00:00:00/40 tag 0 ncq 524288 out
[22734.560263]          res 40/00:04:3f:68:25/00:00:00:00:00/40 Emask 0x10 (ATA bus error)
[22734.560264] ata1.00: status: { DRDY }
[22734.560268] ata1: hard resetting link
[22735.047845] ata1: SATA link up 1.5 Gbps (SStatus 113 SControl 310)
[22735.052069] ata1.00: configured for UDMA/33
[22735.067810] ata1: EH complete
[22735.136249] ata1.00: exception Emask 0x10 SAct 0x3f SErr 0x400100 action 0x6 frozen  

fsck kết quả:

tom@1204-Desktop:~$ sudo fsck /dev/sda1
[sudo] password for tom: 
fsck from util-linux 2.20.1
e2fsck 1.42 (29-Nov-2011)
New_Volume: recovering journal
New_Volume contains a file system with errors, check forced.
Pass 1: Checking inodes, blocks, and sizes
Pass 2: Checking directory structure
Pass 3: Checking directory connectivity
Pass 4: Checking reference counts
Pass 5: Checking group summary information
Free blocks count wrong (236669077, counted=236701938).
Fix<y>? yes

Free inodes count wrong (61048336, counted=61048349).
Fix<y>? yes

Cuối cùng nhưng không kém phần quan trọng là screengrab đọc / ghi, đây là mới. Nó được sử dụng để duy trì khá nhất quán trong suốt thời gian thử nghiệm.

đọc viết screengrab

EDIT- Khi tôi cấp nguồn vào sáng nay, ổ đĩa đã thay đổi từ / dev / sda thành / dev / sdc, lạ. Tôi chắc chắn điều đó đã không xảy ra trước đây và tôi chắc chắn đó là / dev / sda. Tôi đã tráo đổi cáp SATA với một loại tốt đã biết và thấy lỗi tương tự ở khoảng 10GB chuyển. Tôi chưa thay đổi cổng SATA, tôi sẽ thử tiếp theo. (Chỉnh sửa # 2, đó là cổng SATA, thay đổi nó đã khắc phục sự cố. Đánh dấu cái này là quá cục bộ.)

Đầu ra của sudo smartctl -a /dev/sda

=== START OF INFORMATION SECTION === Model Family:     Western Digital Caviar Black Device Model:     WDC WD1002FAEX-00Y9A0 Serial Number:    WD-WCAW30776630 LU WWN Device Id: 5 0014ee 25acf2868 Firmware Version:
05.01D05 User Capacity:    1,000,204,886,016 bytes [1.00 TB] Sector Size:      512 bytes logical/physical Device is:        In smartctl database [for details use: -P show] ATA Version is:   8 ATA Standard is:  Exact ATA specification draft version not indicated Local Time is:    Fri May 25 07:16:18 2012 BST SMART support is: Available - device has SMART capability. SMART support is: Enabled

=== START OF READ SMART DATA SECTION === SMART overall-health self-assessment test result: PASSED

General SMART Values: Offline data collection status:  (0x82)   Offline data collection activity
                    was completed without error.
                    Auto Offline Data Collection: Enabled. Self-test execution status:      (   0)  The previous self-test routine completed
                    without error or no self-test has ever 
                    been run. Total time to complete Offline  data collection:      (16500) seconds. Offline data collection capabilities:           (0x7b) SMART execute Offline immediate.
                    Auto Offline data collection on/off support.
                    Suspend Offline collection upon new
                    command.
                    Offline surface scan supported.
                    Self-test supported.
                    Conveyance Self-test supported.
                    Selective Self-test supported. SMART capabilities:            (0x0003)  Saves SMART data before entering
                    power-saving mode.
                    Supports SMART auto save timer. Error logging capability:        (0x01) Error logging supported.
                    General Purpose Logging supported. Short self-test routine  recommended polling time:    (   2) minutes. Extended self-test routine recommended polling time:    ( 170) minutes. Conveyance self-test routine recommended polling time:      (   5) minutes. SCT capabilities:
           (0x3035) SCT Status supported.
                    SCT Feature Control supported.
                    SCT Data Table supported.

SMART Attributes Data Structure revision number: 16 Vendor Specific SMART Attributes with Thresholds: ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE   1 Raw_Read_Error_Rate     0x002f   200   200   051    Pre-fail  Always  
-       0   3 Spin_Up_Time            0x0027   176   173   021    Pre-fail  Always       -       4183   4 Start_Stop_Count        0x0032 100   100   000    Old_age   Always       -       774   5 Reallocated_Sector_Ct   0x0033   200   200   140    Pre-fail  Always  
-       0   7 Seek_Error_Rate         0x002e   200   200   000    Old_age   Always       -       0   9 Power_On_Hours          0x0032   093   093   000    Old_age   Always       -       5518  10 Spin_Retry_Count        0x0032   100   100   000    Old_age   Always  
-       0  11 Calibration_Retry_Count 0x0032   100   100   000    Old_age   Always       -       0  12 Power_Cycle_Count       0x0032   100   100   000    Old_age   Always       -       772 192 Power-Off_Retract_Count 0x0032   200   200   000    Old_age   Always  
-       39 193 Load_Cycle_Count        0x0032   200   200   000    Old_age   Always       -       736 194 Temperature_Celsius     0x0022  118   111   000    Old_age   Always       -       29 196 Reallocated_Event_Count 0x0032   200   200   000    Old_age   Always  
-       0 197 Current_Pending_Sector  0x0032   200   200   000    Old_age   Always       -       0 198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       0 199 UDMA_CRC_Error_Count    0x0032   200   200   000    Old_age   Always  
-       0 200 Multi_Zone_Error_Rate   0x0008   200   200   000    Old_age   Offline      -       0

SMART Error Log Version: 1 No Errors Logged

SMART Self-test log structure revision number 1 Num  Test_Description  Status                  Remaining  LifeTime(hours)  LBA_of_first_error
# 1  Extended offline    Completed without error       00%      5514         -

SMART Selective self-test log data structure revision number 1  SPAN  MIN_LBA  MAX_LBA  CURRENT_TEST_STATUS
    1        0        0  Not_testing
    2        0        0  Not_testing
    3        0        0  Not_testing
    4        0        0  Not_testing
    5        0        0  Not_testing Selective self-test flags (0x0):   After scanning selected spans, do NOT read-scan remainder of disk. If Selective self-test is pending on power-up, resume after 0 minute delay.

vui lòng bao gồm đầu ra củasudo smartctl -a /dev/sda
ish

5
Hãy thử thay thế cáp SATA; nó có thể là xấu
psusi

@psusi Ý kiến ​​hay, tiếc là không giúp được.
Tom Brossman

Câu trả lời:


12

Làm cách nào để xác nhận điều này, vì các xét nghiệm SMART chỉ ra cách khác?

Các bài kiểm tra SMART bị "cô lập", tức là một khi smartctlra lệnh cho ổ đĩa thực hiện kiểm tra, ổ đĩa sẽ xử lý mọi thứ bên trong và sau đó báo cáo lại. Vì vậy, điều này có thể không tiết lộ vấn đề giữa ổ đĩa / bộ điều khiển và bo mạch chủ của bạn.

  • Suy luận rõ ràng là một cáp xấu, nhưng không được hỗ trợ bởi các biểu đồ tiện ích đĩa; đọc cũng bị ảnh hưởng Tuy nhiên, trao đổi cáp / cổng SATA và xem nếu nó làm cho một sự khác biệt.
  • Chạy tự kiểm tra dài với smartctl -t long; nhanh nhất trong chế độ -Cchụp (ngắt kết nối tất cả các phân vùng!) và khi hoàn tất, hãy kiểm tra trạng thái / lỗi với -l(kiểm tra sẽ hủy bỏ ngay khi phát hiện thấy lỗi)
  • Nếu nó hoạt động, bạn có nhớ bất cứ điều gì có thể đã kích hoạt vấn đề này về phía phần mềm không? Nâng cấp / hạ cấp hạt nhân, v.v.?
  • Cuối cùng, nếu tất cả các đĩa khác của bạn đều ổn, rất có thể đây là một lỗi kỳ lạ với bộ điều khiển ghi bộ đệm ghi của ổ đĩa. Sao lưu dữ liệu và RMA nó càng sớm càng tốt.

    (gửi bất kỳ câu hỏi trong ý kiến ​​và tôi sẽ cập nhật câu trả lời. Chúc may mắn!)


Tôi đã tráo đổi cổng SATA và sao chép> 200GB không có vấn đề gì, có vẻ như đã sửa nó. Cảm ơn các câu trả lời chi tiết.
Tom Brossman

4
@TomBrossman, đây không phải là một hệ thống chipset cầu cát từ khoảng tháng 2 năm 2011 phải không? Họ có một khiếm khuyết khiến các cổng sata bị hỏng theo thời gian và có một thu hồi lớn.
psusi

@psusi Đó là và tôi đã gửi email đến bộ phận hỗ trợ của ASUS để hỏi họ xem họ muốn làm gì để sửa nó. Tôi thậm chí không biết về việc thu hồi. Tốt để biết!
Tom Brossman

3
@TomBrossman, cuối cùng tôi cũng đã tìm được cách thay thế 6 tháng trước. Họ đã cho tôi một số đau buồn rằng việc thu hồi đã kết thúc, nhưng cuối cùng họ đã gửi cho tôi một sự thay thế. Kiểm tra và xem nếu bios liệt kê bước của cầu nam và nếu đó là B2, thì đó là cái bị thu hồi và họ nên thay thế nó.
psusi

3
@TomBrossman: đó là bộ điều khiển Intel SATA bị lỗi trên mobo. Xem phần này để xác minh: event.asus.com/2011/mb/identify_b3_othersboards Bắt rất tốt @psusi! Nếu bạn đang bị lỗi B2, một giải pháp là sử dụng cổng SATA3 là bộ điều khiển của bên thứ ba, thường là Marvell. Đồng thời liên hệ với mfrs và nhà bán lẻ trả phí của Asus cho snafu này, không có da lưng, họ PHẢI thay thế nó nếu là B2.
ish
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.