Chúng tôi có vài chục máy chủ Proxmox (Proxmox chạy trên Debian) và khoảng một tháng một lần, một trong số họ sẽ có kernel hoảng loạn và khóa máy. Điều tồi tệ nhất về các khóa này là khi một máy chủ nằm trên một công tắc riêng biệt so với chủ cụm, tất cả các máy chủ Proxmox khác trên công tắc đó sẽ ngừng đáp ứng cho đến khi chúng tôi có thể tìm thấy máy chủ đã thực sự gặp sự cố và khởi động lại nó.
Khi chúng tôi báo cáo vấn đề này trên diễn đàn Proxmox, chúng tôi được khuyên nên nâng cấp lên Proxmox 3.1 và chúng tôi đã trong quá trình thực hiện điều đó trong nhiều tháng qua. Thật không may, một trong những máy chủ mà chúng tôi đã chuyển sang Proxmox 3.1 đã bị khóa với sự hoảng loạn hạt nhân vào thứ Sáu và một lần nữa tất cả các máy chủ Proxmox trên cùng một công tắc đó đều không thể truy cập được qua mạng cho đến khi chúng tôi có thể xác định vị trí máy chủ bị sập và khởi động lại nó.
Chà, hầu như tất cả các máy chủ Proxmox trên switch ... Tôi thấy thật thú vị khi các máy chủ Proxmox trên cùng một switch đó vẫn còn trên Proxmox phiên bản 1.9 không bị ảnh hưởng.
Dưới đây là ảnh chụp màn hình bảng điều khiển của máy chủ bị sập:
Khi máy chủ bị khóa, phần còn lại của các máy chủ trên cùng một công tắc cũng đang chạy Proxmox 3.1 trở nên không thể truy cập được và được đưa ra như sau:
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
e1000e 0000:00:19.0: eth0: Reset adapter unexpectedly
...etc...
uname - một đầu ra của máy chủ bị khóa:
Linux ------ 2.6.32-23-pve #1 SMP Tue Aug 6 07:04:06 CEST 2013 x86_64 GNU/Linux
pveversion -v output (viết tắt):
proxmox-ve-2.6.32: 3.1-109 (running kernel: 2.6.32-23-pve)
pve-manager: 3.1-3 (running version: 3.1-3/dc0e9b0e)
pve-kernel-2.6.32-23-pve: 2.6.32-109
Hai câu hỏi:
Bất kỳ manh mối nào sẽ gây ra sự hoảng loạn hạt nhân (xem hình trên)?
Tại sao các máy chủ khác trên cùng một công tắc và phiên bản Proxmox sẽ bị loại khỏi mạng cho đến khi máy chủ bị khóa được khởi động lại? (Lưu ý: Có các máy chủ khác trên cùng một công tắc đang chạy phiên bản Proxmox 1.9 cũ không bị ảnh hưởng. Ngoài ra, không có máy chủ Proxmox nào khác trong cùng cụm 3.1 bị ảnh hưởng mà không phải trên cùng một công tắc đó.)
Cảm ơn trước cho tất cả lời khuyên.