Làm cách nào để kiểm tra tuổi thọ còn lại trong SSD hoặc mức độ hao mòn của phương tiện?


31

Chúng ta đều biết rằng SSD có tuổi thọ được xác định trước hạn chế. Làm cách nào để kiểm tra trong Linux tình trạng sức khỏe hiện tại của SSD là gì?

Hầu hết các kết quả tìm kiếm của Google sẽ yêu cầu bạn tra cứu thông tin SMART cho trường phần trăm được gọi là Media_Wearout_Indicator hoặc các chỉ số biệt ngữ khác như Độ bền dữ liệu của Longterm - không tồn tại - Có tôi đã kiểm tra hai ổ SSD, cả hai đều thiếu các trường này. Tôi có thể tiếp tục tìm ổ SSD thứ ba, nhưng tôi cảm thấy các trường không được chuẩn hóa.

Để chứng minh vấn đề ở đây là hai ví dụ.


Với ổ SSD đầu tiên, không rõ trường nào biểu thị mức hao mòn. Tuy nhiên, chỉ có một Unknown_Attribution có RAW VALUE nằm trong khoảng từ 1 đến 100, do đó tôi chỉ có thể cho rằng đó là thứ chúng tôi đang tìm kiếm:

    $ sudo smartctl -A /dev/sda                                             
    smartctl 6.2 2013-04-20 r3812 [x86_64-linux-3.11.0-14-generic] (local build)
    Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

    === START OF READ SMART DATA SECTION ===                                 
    SMART Attributes Data Structure revision number: 1                       
    Vendor Specific SMART Attributes with Thresholds:                        
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      5 Reallocated_Sector_Ct   0x0002   100   100   000    Old_age   Always       -       0
      9 Power_On_Hours          0x0002   100   100   000    Old_age   Always       -       6568
     12 Power_Cycle_Count       0x0002   100   100   000    Old_age   Always       -       1555
    171 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       0
    172 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       0
    173 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       57
    174 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       296
    187 Reported_Uncorrect      0x0002   100   100   000    Old_age   Always       -       0
    230 Unknown_SSD_Attribute   0x0002   100   100   000    Old_age   Always       -       190
    232 Available_Reservd_Space 0x0003   100   100   005    Pre-fail  Always       -       0
    234 Unknown_Attribute       0x0002   100   100   000    Old_age   Always       -       350
    241 Total_LBAs_Written      0x0002   100   100   000    Old_age   Always       -       742687258
    242 Total_LBAs_Read         0x0002   100   100   000    Old_age   Always       -       1240775277

Vì vậy, SSD này đã sử dụng 57% vòng đời viết lại của nó, điều đó có đúng không?


Với ổ đĩa khác, SSD_Life_Left ATTRIBUTE nổi bật, nhưng giá trị Nguyên của nó là 0, cho thấy 0% còn lại, không thể xảy ra đối với một ổ SSD có vẻ khỏe mạnh trừ khi nó sẽ gặp nguy hiểm (chúng ta sẽ thấy trong vài ngày nữa) và nếu nó ghi "0% cuộc sống đã được sử dụng", thì cũng không thể đối với một đĩa cứng bị mòn (mòn = được sử dụng trong hơn một năm).

    > sudo /usr/sbin/smartctl -A /dev/sda
    smartctl 6.2 2013-07-26 r3841 [x86_64-linux-3.11.6-4-desktop] (SUSE RPM)
    Copyright (C) 2002-13, Bruce Allen, Christian Franke, www.smartmontools.org

    === START OF READ SMART DATA SECTION ===
    SMART Attributes Data Structure revision number: 10
    Vendor Specific SMART Attributes with Thresholds:
    ID# ATTRIBUTE_NAME          FLAG     VALUE WORST THRESH TYPE      UPDATED  WHEN_FAILED RAW_VALUE
      1 Raw_Read_Error_Rate     0x000f   104   100   050    Pre-fail  Always       -       0/8415644
      5 Retired_Block_Count     0x0033   100   100   003    Pre-fail  Always       -       0
      9 Power_On_Hours_and_Msec 0x0032   100   100   000    Old_age   Always       -       4757h+02m+17.130s
     12 Power_Cycle_Count       0x0032   099   099   000    Old_age   Always       -       1371
    171 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
    172 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
    174 Unexpect_Power_Loss_Ct  0x0030   000   000   000    Old_age   Offline      -       52
    177 Wear_Range_Delta        0x0000   000   000   000    Old_age   Offline      -       2
    181 Program_Fail_Count      0x0032   000   000   000    Old_age   Always       -       0
    182 Erase_Fail_Count        0x0032   000   000   000    Old_age   Always       -       0
    187 Reported_Uncorrect      0x0032   100   100   000    Old_age   Always       -       0
    194 Temperature_Celsius     0x0022   030   030   000    Old_age   Always       -       30 (Min/Max 30/30)
    195 ECC_Uncorr_Error_Count  0x001c   104   100   000    Old_age   Offline      -       0/8415644
    196 Reallocated_Event_Count 0x0033   100   100   000    Pre-fail  Always       -       0
    231 SSD_Life_Left           0x0013   100   100   010    Pre-fail  Always       -       0
    233 SandForce_Internal      0x0000   000   000   000    Old_age   Offline      -       3712
    234 SandForce_Internal      0x0032   000   000   000    Old_age   Always       -       1152
    241 Lifetime_Writes_GiB     0x0032   000   000   000    Old_age   Always       -       1152
    242 Lifetime_Reads_GiB      0x0032   000   000   000    Old_age   Always       -       3072

Với các thuộc tính SMART, các giá trị thấp hơn sẽ tệ hơn vì ổ đĩa luôn cảnh báo nếu giá trị thấp hơn (hoặc bằng? Không chắc chắn) giá trị ngưỡng. Điều đó đã được nói, thật tuyệt khi có một chỉ báo hao mòn, nhưng tôi hy vọng bạn không tin tưởng vào dữ liệu quý giá cho bất kỳ một thiết bị lưu trữ nào. Bạn nên chạy nhiều thiết bị lưu trữ theo cách sắp xếp RAID.
Alexios

Làm thế nào để bạn biết dữ liệu của tôi là 'quý giá'? Nó chỉ là một bản sao ngoại tuyến của kiến ​​thức cơ sở dữ liệu của công ty vào máy tính xách tay của tôi. Tôi nhận xét để đưa ra quan điểm rằng mọi người cho rằng quá thường xuyên là một kịch bản sysop. Dù sao cũng cảm ơn bạn đã bình luận.
Tankman

Tất cả dữ liệu là quý giá. :) Chúng tôi bắt đầu theo nguyên tắc đó, sau đó chuyển sang dữ liệu quý hơn (ví dụ: ảnh kỹ thuật số của nhiếp ảnh gia) và ít quý hơn (HĐH - dễ thay thế, nhưng thời gian chết và mất thời gian / doanh thu nếu bạn phải thay thế nó).
Alexios

Cả hai ổ đĩa đều trong giới hạn độ bền. Ổ đĩa đầu tiên chỉ có khoảng 350 GiB trên đó, trong khi ổ đĩa thứ hai có 1,1 TiB trên đó. Tôi không chắc chuyện gì đang xảy ra ở đây ...
bwDraco

Câu trả lời:


19

Trong ví dụ đầu tiên của bạn, cái mà tôi nghĩ bạn đang đề cập đến là "Chỉ số hao mòn phương tiện" trên các ổ đĩa Intel, thuộc tính 233. Có, nó có phạm vi từ 0 đến 100, với 100 là ổ đĩa hoàn toàn mới, chưa sử dụng và 0 bị hao mòn hoàn toàn. Theo ouptut của bạn, lĩnh vực này dường như không tồn tại.

Trong ví dụ thứ hai của bạn, vui lòng đọc các tài liệu chính thức về SSD_Life_Left. Trên trang đó:

Giá trị RAW của thuộc tính này luôn là 0 và không có nghĩa. Kiểm tra giá trị chuẩn hóa thay thế. Nó bắt đầu từ 100 và cho biết tỷ lệ phần trăm xấp xỉ của tuổi thọ SDD còn lại. Nó thường giảm khi các khối Flash được đánh dấu là xấu, hãy xem giá trị RAW của Retired_Block_Count

Điều thực sự quan trọng là bạn hoàn toàn hiểu những gì smartctl (8) đang nói và không đưa ra các giả định. Thật không may, các công cụ SMART không phải lúc nào cũng cập nhật với SSD mới nhất và thuộc tính của chúng. Như vậy, không phải lúc nào cũng có một cách rõ ràng để nói số lần chip được ghi vào. Điều tốt nhất bạn có thể làm là nhìn vào "Power_On_Hours", trong trường hợp của bạn là "6568", xác định mức sử dụng đĩa trung bình của bạn và tính trung bình.

Bạn sẽ có thể tra cứu thông số kỹ thuật ổ đĩa của bạn và xác định quy trình được sử dụng để tạo ra các chip. Chip quá trình 32nm sẽ có độ bền ghi dài hơn so với chip quá trình 24nm. Tuy nhiên, có vẻ như "trung bình", bạn có thể mong đợi khoảng 3.000 đến 4.000 bài viết, với tối thiểu 1.000 và tối đa là 6.000. Vì vậy, nếu bạn có ổ SSD 64 GB, thì bạn nên mong đợi ở đâu đó trong vùng lân cận có tổng số 192TB đến 256TB được ghi vào ổ SSD, giả sử cân bằng hao mòn.

Ví dụ: nếu bạn duy trì việc sử dụng 11 KBps cho ổ đĩa của mình, thì bạn có thể thấy khoảng 40 MB được viết mỗi giờ. Ở mức 6568 được cung cấp theo giờ, bạn đã ghi khoảng 260 GB vào đĩa. Biết rằng bạn có thể duy trì khoảng 200 TB tổng số lần ghi, trước khi thất bại, bạn có khoảng 600 năm trước khi thất bại do hao mòn chip. Đĩa của bạn có thể sẽ bị hỏng do tụ điện bị hao mòn hoặc điều chỉnh điện áp.


9
Vì vậy, rõ ràng, cảm ơn bạn. Kiến thức này được tạo ra tốt nhất thành một công cụ GUI sử dụng smartctl hoặc API của nó. Sau khi tính toán với máy tính bằng cách sử dụng máy tính làm thiết bị đầu vào và con người ngồi trước máy tính như một bộ xử lý chống lại tinh thần mà máy tính được phát minh!
Tankman 27/12/13

Liên kết của bạn dường như đã chết
Skeleton Bow

15

Đối với SSD Samsung, hãy kiểm tra thuộc tính SMART 177 (Đếm mức độ hao mòn).

ID # 177 Đếm cân bằng mặc

Thuộc tính này đại diện cho số lượng chương trình truyền thông và các hoạt động xóa (số lần một khối đã bị xóa). Giá trị này liên quan trực tiếp đến tuổi thọ của SSD. Giá trị thô của thuộc tính này hiển thị tổng số chu kỳ P / E.

Nguồn: http://www.samsung.com/global/business/sframuctor/minisite/SSD/M2M/doad/07_Cransicating_With_Your_SSD.pdf

Chỉ báo mức độ mòn bắt đầu từ 100 và giảm tuyến tính xuống 1 so với những gì tôi có thể nói. Ở mức 1, ổ đĩa sẽ vượt quá tất cả các chu kỳ p / e được xếp hạng của nó, nhưng trên thực tế, tổng độ bền của ổ đĩa có thể vượt quá đáng kể giá trị đó.

Nguồn: http://www.anandtech.com/show/7173/samsung-ssd-840-evo-review-120gb-250gb-500gb-750gb-1tb-models-tested/3

Tôi sẽ đề nghị bạn lấy tuyên bố cuối cùng về việc vượt quá giá trị đó bằng một hạt muối.


Liên kết đã chết bây giờ.
Giải tích Hiệp sĩ

Tôi nghĩ rằng họ có thứ tự cho Wear_Leveling_Count ngược. Tôi có 2 ổ SSD Samsung và ổ SSD ~ 4 tuổi có RAW_VALUE là 42 và một ổ khác ~ 1 tháng tuổi có RAW_VALUE bằng 0. Có vẻ như nó bắt đầu từ 0 và tăng dần lên.
John Eikenberry

4

Nếu bạn không có SSD thương hiệu Intel: Hãy cẩn thận !! Tôi có một ổ SSD Samsung và tôi đã hoàn toàn bị nhầm lẫn bởi việc dán nhãn thuộc tính sai bởi smartmontools / smartctl. Nếu bạn có bất cứ điều gì ngoại trừ Intel - bạn có thể thấy câu chuyện về nỗi đau (inane) của tôi tại https://askubfox.com/a/460463/65722 hữu ích.

Có thể tỷ lệ chất lượng thông tin của bạn để đào thời gian tốt hơn so với của tôi!


0

có máy chủ có thẻ đột kích LSI , tôi đã cài đặt 7 ổ SSD Samsung.

Nó là như vậy

  • / dev / sda là SSD hệ điều hành của tôi, được đánh dấu là JBOD bởi Raid Controller.
  • 7 ổ SSD khác chỉ hiển thị dưới dạng / dev / sdb vì chúng là RAID 0 (hoặc RAID-?).

để có được thông tin về các đĩa phía sau bộ điều khiển đột kích , mẹo là

smartctl --scan

{output is}
/dev/sda -d scsi # /dev/sda, SCSI device
/dev/sdb -d scsi # /dev/sdb, SCSI device
/dev/bus/0 -d megaraid,8 # /dev/bus/0 [megaraid_disk_08], SCSI device
/dev/bus/0 -d megaraid,9 # /dev/bus/0 [megaraid_disk_09], SCSI device
/dev/bus/0 -d megaraid,10 # /dev/bus/0 [megaraid_disk_10], SCSI device
/dev/bus/0 -d megaraid,11 # /dev/bus/0 [megaraid_disk_11], SCSI device
/dev/bus/0 -d megaraid,12 # /dev/bus/0 [megaraid_disk_12], SCSI device
/dev/bus/0 -d megaraid,13 # /dev/bus/0 [megaraid_disk_13], SCSI device
/dev/bus/0 -d megaraid,14 # /dev/bus/0 [megaraid_disk_14], SCSI device
/dev/bus/0 -d megaraid,15 # /dev/bus/0 [megaraid_disk_15], SCSI device

sau đó để có được thông tin smartctl như

  • WEAR_LEVELING_COUNT
  • POWER_ON_HOURS
  • TEMPERATURE_CELCIUS và tất cả những thứ tốt khác

cho mỗi đĩa làm

smartctl -d megaraid,8 -all /dev/bus/0
smartctl -d megaraid,9 -all /dev/bus/0
smartctl -d megaraid,10 -all /dev/bus/0
{down to}
smartctl -d megaraid,15 -all /dev/bus/0

cú pháp của smartctlsmartctl [options] <device>

đây là cách bạn truy cập và thông qua thẻ đột kích khi nhiều đĩa không hiển thị dưới dạng nhiều thiết bị như / dev / sdb, / dev / sdc, / dev / sdd, v.v.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.