Làm thế nào để làm cho smartd im lặng về một khu vực ngoại tuyến cụ thể không chính xác?


18

Tôi có một đĩa trong phần mềm hai đĩa RAID-1 mà gần đây "khu vực ngoại tuyến không chính xác" xuất hiện trong trạng thái SMART.

198 Offline_Uncorrectable   0x0030   200   200   000    Old_age   Offline      -       1

Đây rõ ràng chỉ là một dấu hiệu của sự cố ổ đĩa sắp xảy ra nếu nó xảy ra ngày càng thường xuyên (và vì ổ đĩa được nhân đôi, nên cũng không có nguy cơ mất dữ liệu thực sự lớn). Vào thời điểm đó, một bài kiểm tra tự cũng thất bại tại một số điểm và smartdđã gửi cho tôi một email để thông báo cho tôi về điều này vì tất nhiên nó nên làm.

Tuy nhiên, việc ghi vào khu vực bị hỏng thường khiến cho đĩa sử dụng một trong những khu vực dự phòng thay vì điều đó rõ ràng là do tôi đã chỉnh sửa ddtrên đĩa, tất cả các bài kiểm tra tự chạy đều ổn. Và badblockscũng không tìm thấy lý do để phàn nàn.

Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
[...]
# 5  Extended offline    Completed without error       00%      5559         -
# 6  Short offline       Completed without error       00%      5540         -
# 7  Short offline       Completed: read failure       90%      5524         63273368

Số lượng các khu vực bị lỗi đã không giảm mặc dù điều đó thực sự không nên, vì khu vực bị hỏng vẫn còn đó, mặc dù không được sử dụng. Tuy nhiên, smartdvẫn tiếp tục gửi email cho tôi mỗi đêm:

The following warning/error was logged by the smartd daemon:

Device: /dev/sda [SAT], 1 Offline uncorrectable sectors

Điều này cực kỳ khó chịu rõ ràng và làm tê liệt phản xạ hoảng loạn lành mạnh của tôi đối với smartdthư.

Đĩa là một WD20EARS kỹ thuật số phương Tây và smartdphiên bản là 5.41 2011-06-09 r3365.

Câu trả lời:


23

Trên một số đĩa, bạn có thể phải dùng đến -U 198+(hoặc -U +?) Trong tệp cấu hình.

Hãy cẩn thận. Nếu bạn không phải là người hỏi ban đầu, hãy đọc kỹ toàn bộ câu hỏi. Nếu bạn sử dụng cái này trên đĩa không cần, nó sẽ loại bỏ hoàn toàn các cảnh báo hợp lệ.

Nếu được chỉ định trong danh sách, báo cáo chỉ được in nếu số lượng giây tăng lên kể từ chu kỳ kiểm tra cuối cùng. Một số đĩa không đặt lại thuộc tính này khi một khu vực xấu được phân bổ lại. Xem thêm ắc-v 198, tăng thêm bên dưới.

smartd.conf (5)

Ví dụ: giả sử bạn đang sử dụng cấu hình mặc định trong smartd.conf. Trong trường hợp đó, có nhiều bình luận trong tệp, nhưng dòng không bình luận duy nhất ở đây:

# The word DEVICESCAN will cause any remaining lines in this
# configuration file to be ignored: it tells smartd to scan for all
# ATA and SCSI devices.  DEVICESCAN may be followed by any of the
# Directives listed below, which will be applied to all devices that
# are found.  Most users should comment out DEVICESCAN and explicitly
# list the devices that they wish to monitor.
DEVICESCAN

Thêm tùy chọn vào cuối dòng:

DEVICESCAN -U 198+

1
-U 198+Hãy làm nó. Đẹp tìm thấy!
Michael Hampton

bất kỳ kỳ thi cho điều này?
JIV

1
@JIV chỉnh sửa. Tôi cũng đã thêm một cảnh báo. Vui lòng cẩn thận với dữ liệu của bạn :-).
nguồn

0

Có hai khả năng những thư này đến từ. smartd có thể tự gửi thư, nhưng rất có thể nó không được cấu hình theo cách này vì vậy tôi cho rằng những thư này được gửi bằng logcheck. Nếu giả định này là sai, bạn không cần phải đọc thêm nữa.

logcheck quét các tệp nhật ký và gửi thư nếu nó nghĩ rằng bạn nên lo lắng về bất cứ điều gì xảy ra với / trên hệ thống của bạn.

Bạn có tùy chọn để viết quy tắc bỏ qua logcheck, thông báo logcheck để không gửi tin nhắn phù hợp với một mẫu cụ thể.

Bạn có thể (trong các hệ thống dựa trên Debian) tạo một tệp có tên "/etc/logcheck/ignore.d.server/smartd_own" với nội dung sau:

^\w{3} [ :0-9]{11} [._[:alnum:]-]+ smartd\[[0-9]+\]: Device: /dev/sda \[SAT\], 1 Offline uncorrectable sectors$

Điều này sẽ lọc ra các thư gây phiền nhiễu nhưng viết lại cho bạn nếu bộ đếm ngành không chính xác tăng.


smartdkhông may gửi tin nhắn trực tiếp Nó rõ ràng luôn luôn là một lựa chọn để thay đổi điều này mặc dù. Tôi sẽ xem xét điều này nếu không có cách nào khác, vì vậy cảm ơn!
Christian

Oh darn, dù sao bạn có một cách giải quyết bây giờ.
hennr
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.