Các máy chủ Xen của tôi là openSUSE 11.1 với open-iscsi cho cụm iSCSI SAN của chúng tôi. Các mô-đun SAN nằm trong một nhóm chuyển đổi dự phòng IP phía sau một IP ảo mà những người khởi xướng kết nối với.
Trong trường hợp máy chủ SAN chính bị hỏng, thứ cấp sẽ chọn vai trò là mục tiêu. Tất cả được xử lý bởi phần mềm LeftHand SAN / iQ và hoạt động tốt trong hầu hết các tình huống.
Vấn đề tôi gặp phải là đôi khi một số Xen DomUs của tôi sẽ có hệ thống tập tin gốc của chúng chỉ đọc sau khi chuyển đổi IP. Nó không nhất quán và xảy ra với một tập hợp con khác nhau mỗi khi xảy ra lỗi chuyển đổi dự phòng. Tất cả đều chạy cùng một hình ảnh phần mềm openSUSE 11.1.
Các hệ thống tập tin gốc cho mỗi DomU được gắn kết bằng iscsi mở trong Dom0 và sau đó Xen sử dụng trình điều khiển thiết bị khối tiêu chuẩn để hiển thị nó cho DomU.
Triệu chứng chính xác là một root khi chạy touch /test
sẽ trả về lỗi "hệ thống tập tin chỉ đọc". Tuy nhiên, đầu ra của mount
nó cho thấy nó được gắn đọc-ghi. Tất nhiên, tất cả các I / O khác trên domU cũng bị lỗi tại thời điểm này nên máy bị hỏng. Chỉ cần khởi động lại nó xm
từ Dom0 mà không cần kết nối lại phiên iSCSI sẽ khiến mọi thứ hoạt động trở lại.
Về phía Dom0, các thông báo nhật ký hệ thống trong quá trình chuyển đổi dự phòng giống như sau:
kernel: connection1:0: iscsi: detected conn error (1011)
iscsid: Kernel reported iSCSI connection 1:0 error (1011) state (3)
iscsid: connection1:0 is operational after recovery (1 attempts)
Tôi đang có một thời gian khó khăn để tìm ra lớp nào để gỡ lỗi vấn đề này, nó có phải là một cái gì đó trong hạt nhân DomU không? hoặc ở cấp độ Dom0 hoặc Xen? Tôi nghĩ rằng có khả năng một số tham số ở đâu đó cần điều chỉnh để tăng thời gian chờ, nhưng tôi không chắc chắn nên tìm ở đâu.
Tôi thực sự không nghĩ rằng đó là một vấn đề với open-iscsi đơn giản vì thiết bị khối được kết nối vẫn có thể đọc và ghi được từ Dom0.