HADR sử dụng chủ đề công nhân cao


10

Tại sao số lượng luồng công nhân của nhóm khả dụng trong nhóm HADR sẽ tăng vượt quá mức sử dụng tối thiểu " thông thường, có 3 luồng chia sẻ10 " trên mỗi bản sao?

Trong một trường hợp, chúng tôi đã quan sát thấy việc sử dụng hơn 300 luồng với 3 nhóm khả dụng và tổng số 10 cơ sở dữ liệu. Máy chủ SQL 2014 SP1.

Khách hàng tiềm năng của chúng tôi là sao lưu trên bản sao thứ cấp, hoạt động cao trên bản sao chính, báo cáo về bản sao thứ cấp.

Các AG đang ở trong một trung tâm dữ liệu trên VMware. Tổng cộng 16 lịch trình, chủ đề công nhân thông thường là dưới 200 phạm vi. max_dop trên máy chủ là 2.

  • 3 AG, 10 DB, mỗi bản sao 4 - chính, 2 chỉ đọc, 1 không đọc được.
  • 1 phụ là đồng bộ, 2 không đồng bộ
  • 16 vcores trên 32 lõi vật lý trên cụm máy chủ lớn.
  • Không cung cấp quá nhiều.
  • Các máy ảo nhỏ hơn 4-8 lõi khác được tạo ra, nhưng chúng không nhấn vào CPU

Chúng tôi quan sát thấy một sự tăng đột biến trong các chủ đề công nhân dẫn đến sự từ chối dịch vụ. Ghi công của các luồng công nhân cho AG là giả định của chúng tôi, vì chỉ những luồng công nhân đó mới có thể vượt qua giới hạn.

Bên dưới các liên kết từ SQL Server Premier Field Engineering Blog đọc trong ngữ cảnh không đưa ra câu trả lời hoàn chỉnh cho tôi:


3
Bạn có thể đăng các ví dụ ảnh chụp màn hình về những gì bạn đang nhìn thấy? Một cái gì đó dường như tắt ở đây, giống như bạn đang truy vấn các luồng công nhân nói chung trái ngược với các AG cụ thể. (Và các luồng công nhân khác cũng có thể vượt qua giới hạn, không chỉ các AG.)
Brent Ozar

Tôi đang săn một vấn đề tương tự. Khá chắc chắn rằng tôi đã đóng đinh nó vào vấn đề MaxDop. Tôi đang sử dụng các tập lệnh Ola Hallengreen cho IndexMaintenance và cài đặt MaxDOP được đặt ở NULL. Vấn đề là, bạn có thể có các truy vấn đến không, ghi đè lên MaxDOP 2 của bạn?
Kasper Brandenburg

Bạn đã có được giải pháp nào cho việc này chưa?
trusha

Câu trả lời:


-1

Vì DC của bạn là trên VM, tôi nghi ngờ bạn đang gặp hiệu năng đĩa kém. Hiệu suất đĩa kém có thể dẫn đến thời gian ghi nhật ký chậm hơn trên thứ cấp, điều này có thể dẫn đến việc xác nhận chậm hơn trở lại bản sao chính từ bản sao thứ cấp (luồng xử lý công nhân cạn kiệt).

Độ trễ của đĩa trên Bản sao phụ có thể làm tăng quá trình Cam kết đồng bộ hóa HADR, dẫn đến Chính giữ các luồng mở trong khi chờ Thứ cấp xác nhận giao dịch.

Vui lòng kiểm tra nhật ký lỗi cho Bộ lập lịch bị khóa và thu thập một số số liệu IO từ PerfMon để xem độ trễ của đĩa và độ dài hàng đợi của đĩa.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.