Làm thế nào để SSD thất bại gần cuối đời?


9

Giả sử ổ SSD MLC đã tồn tại rất lâu và tế bào đầu tiên đã đạt được chu kỳ xóa cuối cùng và từ chối xóa.

Điều gì xảy ra sau đó? Bộ điều khiển có phát hiện ra đó là một khối xấu và chuyển sang khối tiếp theo và cố gắng xóa nó đi không? Tổng dung lượng của ổ đĩa sẽ giảm dần theo thời gian?

BIÊN TẬP

Và tất nhiên chúng ta có thể quên đi việc san bằng mặc. Vâng, nó kéo dài tuổi thọ của một ổ đĩa, nhưng tôi không nói về điều đó. Cuối cùng, một tế bào sẽ đạt được chu kỳ xóa cuối cùng của nó.

Câu trả lời:


8

Các chip flash NAND có một số cơ chế tích hợp để phát hiện lỗi trong các hoạt động ghi và xóa và sẽ cảnh báo cho bộ điều khiển nếu một lỗi. Trong trường hợp này, bộ điều khiển có thể thử lại hoặc coi khối đó là xấu và ánh xạ nó ra khỏi thuật toán cân bằng hao mòn của nó. Mỗi trang trong thiết bị NAND cũng có một khu vực dự phòng bên cạnh khu vực dữ liệu chính, dành cho siêu dữ liệu như ECC và các hình thức phát hiện lỗi và dung sai khác. Bộ điều khiển có thể quyết định sơ đồ chịu lỗi của chính nó bằng cách sử dụng vùng dự phòng. Mã Hamming là một lược đồ phổ biến, mặc dù có một số, bao gồm các bit chẵn lẻ đơn giản và mã Reed-Solomon. Nếu mọi thứ không khớp với thao tác đọc, một lần nữa, bộ điều khiển có thể tự do làm điều đó. Lý tưởng nhất, nó cũng sẽ ánh xạ các khối này ra khỏi thuật toán cân bằng hao mòn và bạn sẽ mất dần công suất cho đến khi "quá nhiều khối" thất bại, trong đó "quá nhiều" phụ thuộc vào thuật toán và kích thước cấu trúc phần cứng trong bộ điều khiển. Nhiều thiết kế bộ điều khiển cắt đầu tiên chỉ đơn giản là khai báo lỗi cho hệ điều hành.

Lưu ý rằng đây không phải là vấn đề cụ thể của MLC; mặc dù các ô MLC có thể dễ bị lỗi đọc hơn, vì nhất thiết phải có một lề nhỏ hơn cho lỗi, các ô SLC thất bại với hầu hết các cơ chế tương tự và có thể được bộ điều khiển xử lý theo cùng một cách.


2

Cũng giống như với các đĩa cứng, tùy thuộc vào việc triển khai trong hệ điều hành. Bộ điều khiển chỉ đơn giản là báo cáo rằng ghi (xóa thực sự là một thao tác ghi) không thành công và tùy thuộc vào trình điều khiển lệch trong nhân hệ điều hành để quyết định phải làm gì. Từ những gì tôi thấy cho đến nay, các triển khai của Microsoft và Linux chỉ đơn giản trả lại mã lỗi cho ứng dụng gọi điện - do đó, nó tạo ra lỗi I / O.

Nói tóm lại: Bạn chỉ cần lấy một thiết bị "hỏng" tại một số điểm.


Vâng, đó là hút. Không phải là một sự trừu tượng rất tốt sau đó ...
Pyrolistic

1
Và sai. Chủ yếu điều này được xử lý trong chính SSD - không phải trình điều khiển thiết bị. Bởi vì đây là hoạt động bình thường. Mặc cân bằng sẽ ghi lại khu vực là thất bại và ánh xạ lại khu vực.
TomTom

1

SSD sử dụng một cái gì đó gọi là "hao mòn mức độ", trong đó ổ đĩa giữ một thống kê về việc sử dụng ngành và tại một thời điểm nào đó hoặc khi phát hiện ra vấn đề, nó sẽ chuyển khu vực sang dự trữ, giống như nó xảy ra với các ổ cứng thông thường.


Có, nhưng tôi thấy HD cơ học thất bại một cách máy móc trước khi chúng hết các khu vực dành riêng. SSD tuy nhiên có thể không. Điều gì xảy ra khi một ổ đĩa hết các khu vực dành riêng?
Pyrolistic

Viết lỗi. Những gì bạn mong đợi?
TomTom
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.