Tôi có nên lo lắng về giá trị SMART Phần cứng_ECC_Recover cao không?


16

Tôi nhận được một tin nhắn như vậy trong /var/log/messages:


Jun 25 06:29:27 server.ru smartd[4477]: Device: /dev/sda, SMART Usage Attribute: 195 Hardware_ECC_Recovered changed from 46 to 47

#smartctl -a /dev/sda:


smartctl version 5.38 [i686-redhat-linux-gnu] Copyright (C) 2002-8 Bruce Allen
Home page is http://smartmontools.sourceforge.net/

=== START OF READ SMART DATA SECTION ===
SMART Attributes Data Structure revision number: 10
Vendor Specific SMART Attributes with Thresholds:
ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
  1 Raw_Read_Error_Rate     0x000f   110   088   006    Pre-fail  Always       -       28526210
  3 Spin_Up_Time            0x0003   093   093   000    Pre-fail  Always       -       0
  4 Start_Stop_Count        0x0032   100   100   020    Old_age   Always       -       24
  5 Reallocated_Sector_Ct   0x0033   100   100   036    Pre-fail  Always       -       0
  7 Seek_Error_Rate         0x000f   087   060   030    Pre-fail  Always       -       471723621
  9 Power_On_Hours          0x0032   098   098   000    Old_age   Always       -       2520
 10 Spin_Retry_Count        0x0013   100   100   097    Pre-fail  Always       -       0
 12 Power_Cycle_Count       0x0032   100   100   020    Old_age   Always       -       41
187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
189 High_Fly_Writes         0x003a   100   100   000    Old_age   Always       -       0
190 Airflow_Temperature_Cel 0x0022   068   052   045    Old_age   Always       -       32 (Lifetime Min/Max 31/35)
194 Temperature_Celsius     0x0022   032   048   000    Old_age   Always       -       32 (0 27 0 0)
195 Hardware_ECC_Recovered  0x001a   047   045   000    Old_age   Always       -       105036390
197 Current_Pending_Sector  0x0012   100   100   000    Old_age   Always       -       0
198 Offline_Uncorrectable   0x0010   100   100   000    Old_age   Offline      -       0
199 UDMA_CRC_Error_Count    0x003e   200   200   000    Old_age   Always       -       0
200 Multi_Zone_Error_Rate   0x0000   100   253   000    Old_age   Offline      -       0
202 TA_Increase_Count       0x0032   100   253   000    Old_age   Always       -       0

Có nghĩa là đĩa bị lỗi và tôi phải thay thế nó? Tôi có thể đọc về cách giải thích kết quả kiểm tra SMART ở đâu?

Câu trả lời:


13

Theo Steve Gibson của danh tiếng Spinrite , các giá trị SMART phải được thực hiện theo thời gian, không phải là các bài đọc tức thời. Điều đó có nghĩa là, giá trị 47 không hẳn là xấu nếu giá trị đó là 47 trong nhiều tháng. Tuy nhiên, nếu giá trị là 42 giờ trước và tăng nhanh, thì điều đó có nghĩa là ổ đĩa đang gặp khó khăn khi truy cập một phần dữ liệu và có thể sớm không thể đọc được khu vực đó. Tùy thuộc vào giá trị của dữ liệu trên ổ đĩa mà bạn có thể muốn thay thế nó.


+1 cho câu trả lời tuyệt vời và để thêm vào nó. Nếu bạn thực sự quan tâm đến Lexsys, tôi sẽ mua một bản sao của spinrite và chạy nó. Bạn sẽ cần hệ thống của mình để có thể khởi động từ đĩa CD, nhưng HĐH thì không liên quan. (Mặc dù để tạo CD khởi động, bạn sẽ cần Windows hoặc bản sao Windows)
Matt

Spinrite đi kèm với một hình ảnh .iso có thể khởi động (freedo) mà bạn có thể ghi với bất kỳ hệ điều hành hiện tại nào
Dave Cheney

grc.com/sr/spinrite.htmlm sẽ là nơi tốt hơn để liên kết đến
Brad Gilbert

2
Ví dụ là sai! Xem câu trả lời của @ CesarB - đối với hầu hết các giá trị, tăng là tốt! Vì vậy, nếu nó là 42 giờ trước, và bây giờ là 47 - tuyệt vời. Nhưng không phải là cách khác.
Volker Siegel

6

Giá trị cao cho thuộc tính này thực sự khá tốt:

Phần cứng Thông số ECC được khôi phục cho biết thời gian giữa các lỗi được sửa ECC.

https://kb.acronis.com/content/9131


2
Đã thêm những gì tôi tin là trích dẫn trung tâm.
Robert Klemme

Điều này có ý nghĩa ngay cả khi tài nguyên được liên kết biến mất. Cảm ơn Robert.
gà con

4

Đầu tiên, giá trị thấp hơn tệ hơn đối với SMART, không phải giá trị cao hơn (chú ý cách cột ngưỡng luôn thấp hơn giá trị hiện tại). Vì vậy, một giá trị tăng lên là không có lý do để lo lắng. (Tuy nhiên, quy tắc này không áp dụng cho các giá trị thô.)

Các giá trị SMART có xu hướng dao động một chút (ví dụ: giá trị của bạn có thể nằm ở cạnh giữa 46 và 47, do đó, ngay cả những thay đổi nhỏ cũng có thể khiến nó bị lật sang giá trị khác).

smartctl -aĐầu ra của bạn cho thấy giá trị tồi tệ nhất của giá trị này là 45, do đó, nó hơi cao hơn mức bình thường.

Để biết thêm thông tin, hãy xem Wikipedia: thuộc tính ATA SMART .


3

Hãy nhớ rằng ngay cả nghiên cứu sâu rộng mà Google thực hiện đã phát hiện ra rằng một số lượng lớn lỗi ổ đĩa không được dự đoán bởi các lỗi SMART. Có thể những gì bạn thấy là hoàn toàn bình thường, nhưng vì mỗi nhà sản xuất có các số liệu khác nhau để chuyển đổi các giá trị thô thành các giá trị được báo cáo nên khó có thể chắc chắn liệu ổ đĩa của bạn có bị lỗi hay không. Tuy nhiên, một số nguyên lớn không đánh tôi là số lẻ.

Tôi khuyên bạn nên đọc tất cả các ổ đĩa (dd hoặc rsync'ing vào một ổ đĩa mới) và kiểm tra các giá trị SMART khi nó đi cùng. Nếu bạn thấy số nguyên đó hoặc các giá trị được báo cáo, hãy thay đổi nhiều thứ tôi sẽ bắt đầu tìm cách thay thế ổ đĩa.


Huh. Sẽ rất tuyệt nếu có ZFS theo dõi các thuộc tính SMART theo các kiểu sử dụng của chính nó.
i336_

1

Không có gì sai với nó.

Bạn luôn có thể chạy

smartctl -t long /dev/yourdrive

Sau một vài giờ truy vấn kết quả của nó

smartctl -a /dev/yourdrive

chỉ để được chắc chắn.


1

Phần cứng IIC ECC được phục hồi là sửa lỗi khi đọc đĩa, điều này không bình thường đối với đĩa và chúng mã hóa dữ liệu bằng các cơ chế sửa lỗi vì lý do này chính xác. Một số bộ điều khiển cũng hỗ trợ thông tin dự phòng trong các lĩnh vực đĩa và thêm một lớp sửa lỗi khác.

Như Dave Cheney nói rằng các số liệu cần được theo dõi theo thời gian. Những thay đổi hoàn toàn trong các thống kê này là một dấu hiệu của một ổ đĩa bị lỗi. Ngoài ra, hãy theo dõi danh sách khiếm khuyết đã phát triển - nếu danh sách khiếm khuyết đã phát triển bắt đầu hoặc số liệu thống kê SMART bắt đầu thay đổi đáng kể thì bạn nên thay thế ổ đĩa.


1
lol, dự phòng
Dave Cheney
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.