Chúng tôi đã sẵn sàng để thực hiện nâng cấp lớn trên Máy chủ SQL của mình và nhận thấy một số hành vi bất thường với Nhóm sẵn có phân tán mà tôi đang cố gắng giải quyết trước khi tiếp tục.
Tháng trước, tôi đã nâng cấp máy chủ thứ cấp từ xa từ SQL Server 2016 lên SQL Server 2017. Máy chủ này là một phần của nhiều Nhóm sẵn có phân tán (DAG) và Nhóm khả dụng (AG) riêng biệt . Khi chúng tôi nâng cấp máy chủ này, chúng tôi không biết rằng nó sẽ rơi vào trạng thái không thể đọc được , vì vậy trong suốt một tháng qua, chúng tôi chỉ dựa vào máy chủ chính.
Là một phần của bản nâng cấp sắp tới, tôi đã áp dụng bản vá CU 4 cho máy chủ và khởi động lại nó. Khi máy chủ hoạt động trở lại, phần thứ cấp vừa vá cho thấy tất cả các DAG / AG đang đồng bộ hóa mà không có bất kỳ vấn đề nào.
Tuy nhiên, chính đã cho thấy một câu chuyện rất khác nhau. Nó đã báo cáo rằng
- AG riêng biệt đã được đồng bộ hóa mà không có bất kỳ vấn đề
- nhưng các DAG ở trạng thái Không đồng bộ hóa / Không lành mạnh
Sau khi hoảng loạn ban đầu, tôi đã thử những điều sau đây để có được những thứ được đồng bộ hóa lại trong DAGs:
- Từ chính, tôi dừng lại và tiếp tục chuyển động dữ liệu. Điều này đã không bắt đầu đồng bộ hóa dữ liệu.
- Trên phần thứ cấp (cái tôi vừa vá) tôi đã chạy
ALTER DATABASE [<database] SET HADR RESUME;
- thực thi không có lỗi, nhưng không tiếp tục bất kỳ đồng bộ hóa nào
Nỗ lực cuối cùng của tôi trong việc đồng bộ hóa dữ liệu một lần nữa là đăng nhập vào thứ cấp và tự khởi động lại dịch vụ SQL Server. Khởi động lại dịch vụ theo cách thủ công có vẻ hơi cực đoan, vì tôi cho rằng máy chủ được khởi động lại là đủ.
Đã có ai gặp phải vấn đề này khi DAG không bắt đầu đồng bộ hóa với phụ sau khi khởi động lại chưa? Nếu vậy, nó đã được giải quyết như thế nào?
Tôi đã kiểm tra cả nhật ký lỗi của SQL Server và trình xem sự kiện trên máy chủ thứ cấp, không có gì khác thường mà tôi có thể thấy.