Phải làm gì khi cụm Luôn Bật của bạn mất đại biểu?


9

Tôi đã xem xét các quy trình DR của công ty chúng tôi và khi tôi tìm kiếm trực tuyến các giải pháp cho một nhóm đại biểu luôn mất, để so sánh với. Tôi đã có ba trang vào kết quả google trước khi tìm thấy bài đăng SE đầu tiên về chủ đề Phân cụm so với sao chép giao dịch so với các nhóm khả dụng chỉ chạm nhẹ vào chủ đề đại biểu bị mất.

Trong khi tất cả mọi người đồng ý rằng đại biểu mất là xấu, và có một số gợi ý để giảm tiềm năng, nó vẫn có thể xảy ra. Tôi đang tìm kiếm một câu trả lời đánh giá ngang hàng tốt cho con đường tốt nhất để phục hồi sau khi mất một nhóm đại biểu.


Nếu chưa có, tôi khuyên bạn nên thử trên Windows Server 2012 R2. Các đại biểu năng động, nhân chứng năng động và các tính năng ngắt kết nối cho phép bạn đạt được "người đứng cuối cùng" trong rất nhiều trường hợp. sqlha.com/2013/06/06/ từ
Búa SQL

Câu trả lời:


11

AG được dựa trên Windows Clustering. Các quy trình WSFC cho mất đại biểu được áp dụng.

Khi WSFC đang chạy, bạn có thể buộc AG, nếu cần. Thực hiện chuyển đổi dự phòng thủ công cưỡng bức của nhóm khả dụng :

Sau khi buộc đại biểu trên cụm WSFC (đại biểu bắt buộc), bạn cần buộc chuyển đổi dự phòng cho mỗi nhóm khả dụng (có thể mất dữ liệu). Buộc chuyển đổi dự phòng là bắt buộc vì trạng thái thực của các giá trị cụm WSFC có thể đã bị mất. Tuy nhiên, bạn có thể tránh mất dữ liệu, nếu có thể buộc chuyển đổi dự phòng trên phiên bản máy chủ lưu trữ bản sao chính là bản sao chính trước khi bạn buộc đại biểu hoặc bản sao thứ cấp được đồng bộ hóa trước khi bạn buộc đại biểu. Để biết thêm thông tin, hãy xem các cách tiềm năng để tránh mất dữ liệu sau khi đại biểu bị buộc .


Làm thế nào để nó hoạt động với thiết lập AG mới mà không có một cụm? Có còn đại biểu không?
Shaulinator

6

Phải làm gì khi cụm Luôn luôn của bạn mất đại biểu?

Tôi đã gặp phải tình huống này đặc biệt là việc phân cụm nhiều mạng con trải rộng ở nhiều quốc gia khác nhau (NY-LD-HK).

Làm thế nào để tránh mất đại biểu trong cụm đa mạng con?

  • Thay đổi cài đặt mặc định của cụm thành trạng thái giám sát thoải mái hơn, đặc biệt là cài đặt Nhịp tim cụm bằng cách sử dụng CrossSubnetDelayhoặc thuộc CrossSubnetThresholdtính bởi hotfix này .
  • AG sử dụng WSFC mà inturn sử dụng cách tiếp cận dựa trên đại biểu để xác định sức khỏe của cụm. Hãy chắc chắn rằng bạn chọn đúng và cấu hình đại biểu . Bài đăng trên blog này đi sâu hơn vào cấu hình phiếu bầu đại biểu cho Luôn luôn
  • Mọi thứ thay đổi trong máy chủ Windows 2016 với việc giới thiệu các cụm nhận biết trang webnhân chứng đám mây .

    Các nút trong các cụm kéo dài có thể được nhóm lại dựa trên vị trí thực tế của chúng (trang web). Nhận thức trang web cụm tăng cường các hoạt động chính trong vòng đời của cụm như hành vi chuyển đổi dự phòng, chính sách vị trí, nhịp tim giữa các nút và hành vi đại biểu.

    Cloud Witness là một loại nhân chứng đại biểu mới của Failover Cluster sử dụng Microsoft Azure làm điểm phân xử. Nó sử dụng Microsoft Azure Blob Storage để đọc / ghi tệp blob sau đó được sử dụng làm điểm phân xử trong trường hợp phân giải não tách.

Làm gì khi đại biểu bị mất?

  • Nếu cụm bị hỏng do mất điện / thảm họa ngoài dự kiến, thì cần phải can thiệp thủ công. Quản trị viên cửa sổ hoặc quản trị viên cụm phải buộc thủ công đại biểu (liên kết lại với câu trả lời của @ Remus vì điều này bao gồm điểm này) và đưa các nút còn tồn tại trực tuyến.

Như mọi khi, để thực hiện Phân tích nguyên nhân gốc (RCA), hãy thu thập nhật ký cụm cửa sổ của bạn, cho Luôn luôn RCA - sử dụng Nhật ký chẩn đoán cụm chuyển đổi dự phòng SQL Server . Các tệp này trong thư mục SQL Server Log có định dạng sau : <HOSTNAME>_<INSTANCENAME>_SQLDIAG_X_XXXXXXXXX.xel.


0

Khi tôi đã tham gia vào một lần mất điện nơi các máy chủ được nhân đôi của chúng tôi bị mất kết nối. Một trong những điều cần lo lắng là đảm bảo các ứng dụng của bạn được trỏ đến một thể hiện duy nhất. Khi bị cúp mạng, bạn có thể có tất cả các nút của cụm Luôn bật nhưng không thể liên lạc với nhau. Bạn buộc một thất bại đối với một thứ cấp và sau đó miễn là có sự cố mất điện, bạn có thể có hai nút chính vì chính ban đầu sẽ không biết về thất bại bắt buộc.

Tùy thuộc vào vị trí của các máy chủ ứng dụng của bạn, cấu hình của chúng và khả năng tiếp cận máy chủ SQL, theo lý thuyết, bạn có thể có hai nút tin rằng chúng là chính và có dữ liệu thay đổi cùng một lúc. Khi bạn khắc phục các sự cố mạng của mình và các nút tiếp tục kết nối, tất cả dữ liệu đã thay đổi trên bản gốc ban đầu sẽ được ghi đè từ nút nơi lỗi chuyển đổi bắt buộc. Điều này có thể dẫn đến việc mất dữ liệu quan trọng.

Tôi đã thấy tình huống này một lần với SQL 2005 và phản chiếu. Và chúng tôi quyết định không ép buộc thất bại và để nó không thể truy cập được. Lý do là trong trường hợp xấu nhất nếu chúng tôi phải sao lưu và khôi phục để khởi động lại phản chiếu, thì đó sẽ là quá trình 2 ngày đối với chúng tôi với rủi ro nhật ký giao dịch trở nên đầy đủ và không thể mở rộng đĩa trên đó.


Mirrroring và Luôn luôn khác nhau. Với Luôn luôn, bạn (hy vọng) sẽ chỉ vào một người nghe bằng MultiSubnetFailover = True
James Jenkins

Tôi biết điều đó nhưng có thể có các máy chủ được phân tách theo địa lý với sự cố ngừng mạng nơi một số ứng dụng có thể tiếp cận một số máy chủ nhưng không phải các máy chủ khác. Và có các trình điều khiển java đang được sử dụng không hỗ trợ MultiSubnetFailover = True. Có lẽ các ứng dụng bên thứ ba khác là tốt. Tôi đã thấy một số người từ chối cấu hình chuỗi kết nối của họ cho nó. Thậm chí sau đó bạn có thể buộc chuyển đổi dự phòng mà không cần suy nghĩ về tình huống chính xác của mình và kết thúc với hai máy chủ có thể ghi không thể giao tiếp. Và với các ứng dụng viết cho cả hai vì khả năng giao tiếp trên các trang web.
Alen

PS Tôi đã nhìn thấy một tình huống mà chúng tôi không thể giao tiếp với trang web chính của chúng tôi ít hơn một dặm, nhưng khả năng kết nối với trang web của chúng tôi DR 100 dặm chỉ làm việc tốt.
Alen
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.