Tôi có một cụm hai nút với nhịp tim và DRBD quản lý tài nguyên mysql. Việc chuyển đổi dự phòng hoạt động rất tốt nếu tôi tạm dừng chính, khởi động lại hoặc ngắt kết nối mạng.
Tuy nhiên, nếu sơ cấp bị hoảng loạn hạt nhân (mô phỏng bằng cách chạy echo c > /proc/sysrq-trigger
), thì thứ cấp không tiếp quản tài nguyên.
Đây là bản ghi nhịp tim trên thứ cấp trông như thế nào:
Jul 11 21:33:32 rad11 heartbeat: [7519]: WARN: node rad10: is dead
Jul 11 21:33:32 rad11 heartbeat: [7519]: info: Link rad10:eth0 dead.
Jul 11 21:33:32 rad11 heartbeat: [8442]: info: Resetting node rad10 with [Meatware STONITH device]
Jul 11 21:33:32 rad11 heartbeat: [8442]: ERROR: glib: OPERATOR INTERVENTION REQUIRED to reset rad10.
Jul 11 21:33:32 rad11 heartbeat: [8442]: ERROR: glib: Run "meatclient -c rad10" AFTER power-cycling the machine.
Có ai có ý tưởng tại sao thứ cấp không tiếp quản trong tình huống này? Thông thường failover hoạt động rất tốt, nhưng tôi đang cố gắng mô phỏng hạt nhân hoảng loạn trên nút chính.
EDIT: Đây là cấu hình nhịp tim của tôi, ha.cf
# /etc/ha.d/ha.cf
logfile /var/log/ha-log
keepalive 1
deadtime 10
udpport 695
ucast eth0 rad11
auto_failback on
stonith_host rad10 meatware rad11
stonith_host rad11 meatware rad10
node rad10 rad11