Tóm lược
Tôi đã nhận được các tin nhắn khó hiểu này trong syslog kể từ khi tôi cài đặt một số phần cứng mới và tôi không thể tìm ra vấn đề là gì, nếu nó nghiêm trọng hoặc phải làm gì với nó.
Họ đến từ HBA SATA mới và họ theo một mô hình. Tôi sẽ nhận được một số tin nhắn đầu tiên theo sau là một vài tin nhắn thứ hai 5-30 giây sau. Chúng xuất hiện trong các đốm màu được ghi lại trong cùng một giây và số lượng chính xác của mỗi loại khác nhau trong khoảng từ 2 đến 35. Có thể là vài phút hoặc vài giờ giữa các lần xuất hiện của các mục.
Ví dụ về hai thông điệp:
Jul 13 06:06:23 durandal kernel: [366918.435596] mpt2sas0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Jul 13 06:06:28 durandal kernel: [366923.145524] mpt2sas0: log_info(0x31110d01): originator(PL), code(0x11), sub_code(0x0d01)
Nó luôn luôn là 0x31120303 theo sau là 0x31110d01.
mpt2sas là trình điều khiển cho bộ điều hợp bus máy chủ SATA tôi đang sử dụng nhưng nội dung lỗi quá khó hiểu. Nó không cho tôi biết vấn đề là gì, đĩa hoặc cổng đó là gì hoặc mức độ nghiêm trọng của nó.
Phần cứng
Supermicro X9SCL với Xeon E3-1220 và 8GB RAM.
LSI SAS2008 dựa trên Supermicro AOC-USAS2-L8I SAS / SATA HBA được kết nối với bộ khay đĩa Supermicro CSE-M35T-1B . Nó có ba Western Digital WD30EZRX và hai Segate ST3000DM001 được cắm vào nó. Tất cả các ổ đĩa 3TB (chính xác cùng số lượng ngành). Không có cổng mở rộng sử dụng.
HBA, khay đĩa và 4 ổ đĩa là mới. Một trong những chiếc WD30EZRX đã hoạt động được vài tháng, không có vấn đề gì với nó. Nếu nó được kết nối với bộ điều khiển Intel tích hợp Intel trước đó, hãy chuyển nó vào khoang ổ đĩa với thiết lập mới này.
Có vấn đề với HBA cần phải thiết lập lại thường xuyên và có hiệu suất thực sự khủng khiếp. Đã cập nhật firmware / bios thành "Giai đoạn 12", bản phát hành mới nhất có sẵn từ Supermicro và đã thay đổi loại thành CNTT (tức là thông qua, từ IR cho cuộc đột kích tích hợp kể từ khi tôi sẽ sử dụng tất cả các cuộc đột kích phần mềm): 2008IT12.FW. Bản cập nhật đó đã xóa tất cả các vấn đề ban đầu và tôi đã không bắt đầu nhận được các tin nhắn trên cho đến sau này (xem bên dưới).
Bốn đĩa đầu tiên tôi đã thêm đều nằm trên cổng SFF-8087 đầu tiên (tách thành 4 cáp SATA). Đĩa mới nhất tôi đã thêm là trên cổng khác, nếu đó là vấn đề.
Đĩa duy nhất khác trên hệ thống chứa HĐH và là ổ SSD Intel 80GB cũ hơn được cắm vào bộ điều khiển SATA tích hợp.
Phần mềm
Ubuntu 11.10 (một chiều). Linux 3.0.0-14-máy chủ x86_64. Sử dụng trình điều khiển mpt2sas đi kèm với HĐH.
Cố gắng xây dựng một mảng RAID6 bằng Linux md với năm đĩa đó. Bắt đầu với một mảng suy biến gồm 3 đĩa, hai Segate và một trong các ổ WD mới. Điều này rất nhanh và diễn ra rất tốt, không có tin nhắn nào trong nhật ký sau khi tôi cập nhật firmware. Trong khi đó, tôi vẫn đang sử dụng đĩa WD cũ trên cổng 0 của cùng một bộ điều khiển.
Đã thêm đĩa WD mới khác vào mảng. Rebuild bắt đầu và bây giờ tôi nhận được những tin nhắn đó trong syslog theo định kỳ. Tôi không chắc sẽ mất bao lâu để thêm một đĩa vào mảng nhưng thời gian ước tính (cat / Proc / mdstat) dao động từ hàng ngàn đến hàng chục nghìn phút, lâu hơn nhiều so với 3 đĩa đầu tiên. Tôi hiểu rằng các đĩa WD chậm hơn nhiều; Tôi có các mô hình khác nhau để giảm khả năng bị hỏng đĩa và đó là hai mô hình 3TB rẻ nhất.
Ghi chú
SMART không báo cáo bất kỳ vấn đề nào trên bất kỳ đĩa nào. Không có lỗi đăng nhập trên bất kỳ đĩa nào và không có thống kê lỗi nào ở bất kỳ đâu gần ngưỡng.
Các thông điệp được ghi lại chỉ bắt đầu xuất hiện sau khi tôi thêm đĩa cuối cùng, điều này cho thấy rằng một người có thể đang gặp vấn đề nhưng tôi không có gì khác chỉ vào đó.
Tôi đã tìm thấy một tệp tiêu đề dường như tương ứng với các thông điệp đăng nhập từ trình điều khiển này. Thông báo đầu tiên dường như là hủy bỏ (mã 12) cho "mã phụ" 0303 không được liệt kê. Thông báo thứ hai là thiết lập lại (mã 11) vì một lý do không rõ ràng. Nếu tôi có thể xác định 0303 và 0d01 có nghĩa là gì, điều đó sẽ thực sự hữu ích.
Tôi biết rằng 4 đĩa trong RAID6 5 đĩa là một mảng không hoàn chỉnh. Tôi dự định sao chép nội dung của đĩa cũ vào mảng sau khi hoàn thành việc tích hợp đĩa thứ 4 và sau đó thêm đĩa cũ vào mảng.