Tôi có một máy chủ HP ProLiant DL380 G7 đang hoạt động như một đơn vị lưu trữ NexentaStor . Máy chủ có RAM 36 GB, 2 bộ điều khiển SAS LSI 9211-8i (không có bộ mở rộng SAS), 2 ổ đĩa hệ thống SAS, 12 ổ dữ liệu SAS, đĩa dự phòng nóng, bộ đệm L2ARC Intel X25-M và bộ tăng tốc PCI ZIL DDRdrive. Hệ thống này phục vụ NFS cho nhiều máy chủ VMWare. Tôi cũng có khoảng 90-100GB dữ liệu trùng lặp trên mảng.
Tôi đã có hai sự cố khi hiệu năng bị giảm đột ngột, khiến các máy khách VM và các bảng điều khiển SSH / Web Nexenta không thể truy cập được và yêu cầu khởi động lại toàn bộ mảng để khôi phục chức năng. Trong cả hai trường hợp, đó là SSD Intel X-25M L2ARC bị lỗi hoặc bị "tắt". NexentaStor không thông báo cho tôi về lỗi bộ nhớ cache, tuy nhiên cảnh báo ZFS FMA chung có thể nhìn thấy trên màn hình bảng điều khiển (không phản hồi).
Đầu zpool status
ra cho thấy:
pool: vol1
state: ONLINE
scan: scrub repaired 0 in 0h57m with 0 errors on Sat May 21 05:57:27 2011
config:
NAME STATE READ WRITE CKSUM
vol1 ONLINE 0 0 0
mirror-0 ONLINE 0 0 0
c8t5000C50031B94409d0 ONLINE 0 0 0
c9t5000C50031BBFE25d0 ONLINE 0 0 0
mirror-1 ONLINE 0 0 0
c10t5000C50031D158FDd0 ONLINE 0 0 0
c11t5000C5002C823045d0 ONLINE 0 0 0
mirror-2 ONLINE 0 0 0
c12t5000C50031D91AD1d0 ONLINE 0 0 0
c2t5000C50031D911B9d0 ONLINE 0 0 0
mirror-3 ONLINE 0 0 0
c13t5000C50031BC293Dd0 ONLINE 0 0 0
c14t5000C50031BD208Dd0 ONLINE 0 0 0
mirror-4 ONLINE 0 0 0
c15t5000C50031BBF6F5d0 ONLINE 0 0 0
c16t5000C50031D8CFADd0 ONLINE 0 0 0
mirror-5 ONLINE 0 0 0
c17t5000C50031BC0E01d0 ONLINE 0 0 0
c18t5000C5002C7CCE41d0 ONLINE 0 0 0
logs
c19t0d0 ONLINE 0 0 0
cache
c6t5001517959467B45d0 FAULTED 2 542 0 too many errors
spares
c7t5000C50031CB43D9d0 AVAIL
errors: No known data errors
Điều này đã không kích hoạt bất kỳ cảnh báo từ bên trong Nexenta.
Tôi có ấn tượng rằng một lỗi L2ARC sẽ không ảnh hưởng đến hệ thống. Nhưng trong trường hợp này, nó chắc chắn là thủ phạm. Tôi chưa bao giờ thấy bất kỳ đề xuất nào đối với RAID L2ARC. Việc loại bỏ hoàn toàn ổ SSD xấu khỏi máy chủ đã giúp tôi chạy lại, nhưng tôi lo ngại về tác động của lỗi thiết bị (và có thể thiếu thông báo từ NexentaStor).
Chỉnh sửa - SSD nào được lựa chọn tốt nhất hiện tại cho các ứng dụng bộ đệm L2ARC hiện nay?