Chúng tôi có một cụm hai nút được thiết lập đang chạy SQL Server 2012 trên Windows Server 2012 R2. Các cụm cơ sở chỉ bao gồm hai nút. Nhóm đại biểu được thiết lập dưới dạng đa số nút + đĩa, với một đĩa được chia sẻ nằm trên một mảng EqualLogic kết nối qua iSCSI. Cấu hình cụm xác nhận không có lỗi.
Đầu ngày hôm nay, hai Nhóm sẵn có đang chạy trên cụm (cả chính trên Nút số 1) đã chuyển sang trạng thái phân giải trên cả hai nút. Nhìn vào các sự kiện cụm, không có gì cho đến khi nó cố gắng khởi động lại dịch vụ. Mọi thứ bên dưới cụm Windows Failover hiển thị màu xanh lá cây (trực tuyến và không có cảnh báo) - đĩa, giao diện mạng, nút, v.v.
Nhìn vào nhật ký ứng dụng trong Windows Event Viewer, sự kiện cho thấy các Nhóm khả dụng đang vào trạng thái Giải quyết đã được yêu cầu làm như vậy bởi cụm vì không thể thiết lập một đại biểu. Tôi không thể tìm thấy bất cứ điều gì khác trong bất kỳ nhật ký nào để hỗ trợ điều này và đại biểu thông qua trong quá trình xác nhận cụm.
Các AG không phục hồi. Chúng tôi đã tìm thấy trong nhật ký Luôn luôn trong nhật ký Máy chủ SQL rằng nút đầu tiên có lỗi điểm cuối phản chiếu. Điều này xảy ra ngay sau khi vi phạm quyền truy cập bộ nhớ với các triệu chứng tương tự như sự cố Microsoft đã giải quyết với Bản cập nhật tích lũy 6, vì vậy chúng tôi sẽ thử tiếp theo.
Tôi đã có thể khởi động lại dịch vụ SQL Server trên nút 1 (dịch vụ vi phạm quyền truy cập bộ nhớ mà ghi chú thứ hai không thể giao tiếp) và tôi đã có thể đưa nhóm khả dụng trở lại trực tuyến tại thời điểm đó. Khởi động lại cũng đưa mọi thứ trở lại 100%.
Bạn có hiểu biết sâu sắc về lý do tại sao điều đó sẽ không làm hỏng nút 1 và giữ cho cơ sở dữ liệu tồn tại trên nút 2 khi điểm cuối phản chiếu không thành công? Chúng tôi hiện đang ở cấp độ 3 AG; sẽ mang đến tối đa 4 điều đó gây ra lỗi trên nút 1 trong khi để dịch vụ còn sống trên nút 2?