Làm thế nào để tôi thoát khỏi tình huống này một cách an toàn?
Chi tiết như sau:
Một máy chủ xen đã có các thiết bị khối được phân bổ cho VM. Nhưng những thiết bị này cũng đã được gắn bên trong Xen.
Trong thực tế, 44 thiết bị khối này đã được gắn kết như thế này. Để làm cho vấn đề tồi tệ hơn, mỗi thiết bị vật lý được nhìn thấy trên 4 đường dẫn và mỗi đường dẫn được gắn trên một điểm gắn kết riêng. Nói cách khác, các thiết bị thực sự được gắn 5 lần mỗi cái.
HĐH máy khách VM nhìn thấy đường dẫn qua thiết bị giả PowerPath (được phân bổ dưới dạng thiết bị chặn phy: cho domU)
Một số thiết bị được định dạng là ext2 và reiserfs.
Không cần phải giải thích cho tôi các rủi ro tham nhũng hệ thống tập tin ở đây.
Tôi sợ rằng ngay cả việc ngắt kết nối các hệ thống tệp có thể gây ra tham nhũng và cảm thấy rằng tại thời điểm này, rút điện từ máy chủ, là lựa chọn an toàn nhất .
Lưu ý rằng hầu hết các ứng dụng, cơ sở dữ liệu Oracle, trong tất cả các máy ảo vẫn đang chạy và đang sử dụng.
Tôi phát hiện ra điều này khi điều tra việc sử dụng CPU cao trên dom0. Có một quá trình "tìm" không thành công, với cwd -> / media / đĩa-12 được gắn từ / dev / sdf1, thuộc về / dev / emcpowerr
Trước khi có ai hỏi, có một lần tôi đã thấy các quy trình không thể bị giết và tiếp tục sử dụng CPU và RAM (không giống như quy trình không còn tồn tại / zombie), là khi có các I / O được cam kết nổi bật, ví dụ như đã đồng bộ hóa trở lại nhưng chưa có trên đĩa . Thông thường hơn điều này xảy ra trên băng I / O.
Gợi ý!?
Tái bút: Tôi có dự kiến các thiết bị sẽ được "dành riêng" một khi được gắn, để ngăn chặn điều này không? Hay điều đó là không thể trên Linux?
EDIT: Đầu tiên tôi tin rằng KDE trong hypanneror) là thủ phạm. Có vẻ như KDE đang gắn các thiết bị có thể khi đăng nhập để tạo biểu tượng trên màn hình. Tuy nhiên, điều tương tự không xảy ra trên các máy chủ Xen khác, nhưng tất cả các máy chủ khác đang chạy phiên bản SLES và KDE cũ hơn nhiều ... V4 dường như là một máy vi phạm, với 3,4 hoạt động tốt hơn).
Hơn nữa, hai VM không quan trọng đã bị treo. Sau khi tắt chúng, chúng sẽ không khởi động lại do hỏng hệ thống tệp. VM chính / sản xuất vẫn đang chạy và cơ sở dữ liệu trên nó vẫn hoạt động, nhưng rõ ràng đây là một quả bom hẹn giờ. Khách hàng đang cố gắng xây dựng lại môi trường trên một máy ảo khác trên một máy chủ khác nhưng bị kẹt trong các vấn đề cấu hình một số thành phần, vì vậy chúng tôi đang chờ ...
Trong mọi trường hợp, tôi cảm thấy rằng không có câu trả lời nào cho đến nay là "thực hành tốt nhất luôn luôn tắt một cách duyên dáng" Và tôi hy vọng sẽ có được một cái gì đó cụ thể hơn ... Trong mọi trường hợp, tôi cảm thấy rằng tình huống này có thể được bảo đảm cẩn thận hơn Suy nghĩ. Việc tắt sẽ khiến IO nổi bật, đặc biệt là các cập nhật dữ liệu meta của hệ thống tệp từ trình ảo hóa, sẽ được đồng bộ hóa và gây ra lỗi hệ thống tệp lớn có khả năng?