Chúng tôi có một máy chủ linux đã được sử dụng nhiều trong 3 năm. Chúng tôi đang chạy một số máy chủ ảo hóa trên đó, một số máy chủ không hoạt động tốt và trong một thời gian đáng kể, công suất io của máy chủ đã bị vượt quá dẫn đến iowait xấu. Nó có 4 ổ đĩa Barracuda sata 500gb được kết nối với bộ điều khiển đột kích 3com. 1 Drive có HĐH và 3 ổ còn lại là thiết lập raid-5.
Bây giờ chúng ta có một cuộc tranh luận về tình trạng của các ổ đĩa và liệu chúng có chủ động thất bại hay không.
Đây là một phần của đầu ra cho 1 trong 4 đĩa. Họ đều có số liệu thống kê tương đối giống nhau:
Số thuộc tính SMART Số sửa đổi cấu trúc dữ liệu: 10 Thuộc tính SMART cụ thể của nhà cung cấp với Ngưỡng: ID # ATTRIBUTE_NAME FLAG GIÁ TRỊ CÔNG CỤ QUA LOẠI ĐƯỢC CẬP NHẬT WHEN_FAILED RAW_VALUE 1 Raw_Read_Error_Rate 0x000f 118 099 006 Luôn luôn thất bại trước - 169074425 3 Spin_Up_Time 0x0003 095 092 000 Luôn luôn thất bại - 0 4 Start_Stop_Count 0x0032 100 100 020 Old_age Luôn luôn - 26 5 Reallocated_Sector_Ct 0x0033 100 100 036 Luôn thất bại trước - 0 7 Seek_Error_Rate 0x000f 077 060 030 Luôn luôn thất bại - 200009354607 9 Power_On_Hours 0x0032 069 069 000 Old_age Luôn luôn - 27856 10 Spin_R tem_Count 0x0013 100 100 097 Luôn luôn thất bại trước - 1 12 Power_Cycle_Count 0x0032 100 100 020 Old_age Luôn luôn - 26 184 Unknown_Attribution 0x0032 100 100 099 Old_age Luôn luôn - 0 187 Báo cáo_ Không chính xác 0x0032 100 100 000 Old_age Luôn luôn - 0 188 Unknown_Attribution 0x0032 100 100 000 Old_age Luôn luôn - 1 189 High_Fly_Wites 0x003a 100 100 000 Old_age Luôn luôn - 0 190 Airflow_Tem Nhiệt độ_Cel 0x0022 071 060 045 Old_age Luôn luôn - 29 (Tối thiểu trọn đời / Tối đa 26/37) 194 Nhiệt độ_Celsius 0x0022 029 040 000 Old_age Luôn luôn - 29 (0 21 0 0) 195 Phần cứng_ECC_Recover 0x001a 046 033 000 Luôn luôn cũ_age - 169074425 197 Hiện tại_Pending_Sector 0x0012 100 100 000 Old_age Luôn luôn - 0 198 Offline_Uncncable 0x0010 100 100 000 Old_age Offline - 0 199 UDMA_CRC_Error_Count 0x003e 200 200 000 Old_age Luôn luôn - 0 Nhật ký lỗi thông minh Phiên bản: 1 Không có lỗi được ghi lại
Giải thích của tôi về điều này là chúng tôi đã không có bất kỳ thành phần xấu hoặc dấu hiệu nào khác cho thấy bất kỳ ổ đĩa nào đang hoạt động thất bại.
Tuy nhiên, Raw_Read_Error_Rate và Seek_Error_Rate cao đang được chỉ ra là dấu hiệu cho thấy các ổ đĩa đang chết.