Chờ đợi tăng lên trong thời gian kiểm tra sau khi nâng cấp để lưu trữ tốt hơn


9

Khi chúng tôi di chuyển từ một mảng flash cũ hơn, sang một mảng flash mới hơn (nhà cung cấp khác, nhưng được thiết lập tốt), chúng tôi bắt đầu thấy sự chờ đợi tăng lên trong SQL Sentry trong các điểm kiểm tra.

Phiên bản: SQL Server 2012 Sp4

Trên bộ lưu trữ cũ của chúng tôi, thời gian chờ đợi của chúng tôi là khoảng 2k với "gai" đến 2500 trong một điểm kiểm tra, với bộ lưu trữ mới, các mức tăng đột biến thường là 10k với mức đỉnh gần 50k. Sentry chỉ cho chúng tôi nhiều hơn về phía PAGEIOLATCHmiễn phí. Thực hiện phân tích riêng của chúng tôi, nó dường như là một sự kết hợp của PAGEIOLATCH and PAGELATCHchờ đợi. Sử dụng Perfmon, chúng ta thường có thể nói rằng càng nhiều trang chúng tôi kiểm tra, chúng tôi càng chờ đợi nhiều hơn, nhưng chúng tôi chỉ xả ~ 125 mb trong điểm kiểm tra. Khối lượng công việc của chúng tôi chủ yếu là viết (chèn / cập nhật chủ yếu).

Nhà cung cấp lưu trữ đã chứng minh cho chúng tôi rằng mảng được gắn trực tiếp của Kênh sợi quang đang phản hồi phụ 1 ms trong các sự kiện điểm kiểm tra này. HBA cũng xác nhận số của mảng. Chúng tôi cũng không tin đó là sự cố xếp hàng HBA vì độ sâu hàng đợi không bao giờ vượt quá 8. Chúng tôi cũng đã thử một HBA mới hơn, thay đổi ZIO, điều tiết thực thi và cài đặt độ sâu hàng đợi thành vô ích. Chúng tôi cũng đã tăng bộ nhớ của máy chủ từ 500 GB lên 1 TB mà không thay đổi. Trong quá trình kiểm tra, chúng tôi thấy 2 - 4 lõi riêng lẻ (16) tăng đột biến đến 100%, nhưng tổng thể CPU là khoảng 20%. BIOS được thiết lập để hiệu suất cao là tốt. Tuy nhiên, điều thú vị là chúng ta thấy các CPU nói chung ở trạng thái ngủ C2 mặc dù chúng ta đã vô hiệu hóa điều đó, vì vậy chúng ta vẫn đang nghiên cứu tại sao trạng thái ngủ vượt qua C1.

Chúng ta có thể thấy rằng hầu hết tất cả các chờ đều nằm trên các trang dữ liệu với loại trang PFS không thường xuyên của loại trang DCM. Chờ đợi là trong DB người dùng, không phải tempdb. Chúng tôi cũng thấy rằng sự chờ đợi đã qua một số trang dữ liệu, với một số SPID đang chờ trên cùng một trang. Thiết kế cơ sở dữ liệu có một vài điểm nóng chèn, nhưng thiết kế tương tự được đặt với bộ lưu trữ cũ.

Chạy một vòng lặp của truy vấn này 100 lần, chúng tôi có thể biết có bao nhiêu SPID đang chờ trên đĩa so với bộ nhớ

SELECT
    [owt].[wait_type], count(*) as waitcount
FROM sys.dm_os_waiting_tasks [owt]
WHERE [owt].[wait_type] LIKE 'PAGE%'
group by [owt].[wait_type]
order by 1
GO 100

nhập mô tả hình ảnh ở đây

Điều "tốt đẹp" là chúng ta có thể dễ dàng tái tạo vấn đề trong môi trường hoàn hảo có cùng mảng mô hình và thông số kỹ thuật máy chủ tương tự. Tôi đánh giá cao bất kỳ suy nghĩ về nơi khác để tìm hoặc làm thế nào để thu hẹp vấn đề. Ngay bây giờ các thử nghiệm tiếp theo của chúng tôi bao gồm: một máy chủ mới với bo mạch chủ mới hơn và nhiều CPU hơn; vô hiệu hóa bộ dữ liệu SIOS (mặc dù điều này đã được áp dụng với bộ lưu trữ cũ); thương hiệu HBA khác nhau.

exec sp_Blitz @outputtype = 'markdown'

Ưu tiên 5: Độ tin cậy : - Mô-đun bên thứ ba nguy hiểm - Sophos Limited - Bảo vệ chống tràn bộ đệm Sophos - SOPHOS ~ 2.DLL - mô-đun bên thứ ba nghi ngờ nguy hiểm được cài đặt.

Ưu tiên 200: Thông tin : - Nút cụm - Đây là một nút trong cụm. - TraceFlag On - Cờ theo dõi 1117 được bật trên toàn cầu. - Cờ Trace 1118 được kích hoạt trên toàn cầu. - Cờ dấu vết 3226 được kích hoạt trên toàn cầu.

Ưu tiên 200: Cấp phép : - Tính năng Phiên bản doanh nghiệp đang sử dụng * xxxxx - Cơ sở dữ liệu [xxxxxx] đang sử dụng Nén. Nếu cơ sở dữ liệu này được khôi phục trên máy chủ Standard Edition, khôi phục sẽ thất bại trên các phiên bản trước 2016 SP1. * xxxxx - Cơ sở dữ liệu [xxxxxx] đang sử dụng Phân vùng. Nếu cơ sở dữ liệu này được khôi phục trên máy chủ Standard Edition, khôi phục sẽ thất bại trên các phiên bản trước 2016 SP1.

Ưu tiên 240: Số liệu thống kê chờ : - Không phát hiện được sự chờ đợi đáng kể nào - Máy chủ này có thể chỉ ngồi không hoạt động hoặc ai đó có thể đã xóa số liệu thống kê chờ gần đây.

Ưu tiên 250: Thông tin máy chủ: - Phần cứng - Bộ xử lý logic: 16. Bộ nhớ vật lý: 512GB. - Phần cứng - NUMA Cấu hình - Nút: 0 Trạng thái: ONLINE Bộ lập lịch trực tuyến: 8 Bộ lập lịch ngoại tuyến: 0 Nhóm bộ xử lý: 0 Nút bộ nhớ: 0 Bộ nhớ VAS Dành riêng GB: 1177 - Nút: 1 Trạng thái: Bộ lập lịch trực tuyến: 8 Bộ lập lịch ngoại tuyến: 0 Bộ xử lý ngoại tuyến Nhóm: 0 Nút bộ nhớ: 1 Bộ nhớ VAS Dành riêng GB: 0 - Gói điện - Máy chủ của bạn có CPU 3.50GHz và đang ở chế độ năng lượng hiệu suất cao - Máy chủ Khởi động lại lần cuối - Ngày 4 tháng 7 năm 2018 - Máy chủ SQL Khởi động lại lần cuối - Ngày 5 tháng 7 2018 5:11 AM - Dịch vụ máy chủ SQL - Phiên bản: 11.0.7462.6. Cấp độ bản vá: SP4. Phiên bản: Phiên bản doanh nghiệp (64-bit). Các nhóm khả dụng đã bật: 1. Trạng thái Trình quản lý nhóm khả dụng: 1 - Máy chủ ảo - Loại: (HYPERVISOR) - Phiên bản Windows - Bạn đang chạy phiên bản Windows khá hiện đại: Server 2012R2, phiên bản 6.3

Ưu tiên 200: Cấu hình máy chủ không mặc định: - Tác nhân XP - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - mặc định nén sao lưu - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - ngưỡng quá trình bị chặn - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 20. - ngưỡng chi phí cho tính song song - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 5 và nó đã được đặt thành 30. - Database Mail XPs - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - mức độ song song tối đa - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 8. - bộ nhớ máy chủ tối đa (MB) - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 2147483647 và nó đã được đặt thành 496640. - bộ nhớ máy chủ tối thiểu (MB) - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 8196. - tối ưu hóa cho khối lượng công việc đặc biệt - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - truy cập từ xa - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 1 và nó đã được đặt thành 0. - kết nối quản trị viên từ xa - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - quét các procs khởi động - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - hiển thị các tùy chọn nâng cao - Tùy chọn sp_cool này đã được thay đổi. Giá trị mặc định của nó là 0 và nó đã được đặt thành 1. - xp_cmdshell - Tùy chọn sp_cool này đã được thay đổi.


quên đề cập đến ... SQL 2012 SP4
Doley 19/07/18

Bạn có thể chạy sp_Blitz với @OutputType = 'MARKDOWN'và đăng kết quả không?
Kin Shah

Tôi đã thêm chúng vào bài viết (những cái tôi nghĩ là hữu ích).
Doley

Bạn đã thực hiện một nhiệm vụ nặng nề I / O như xây dựng lại một chỉ số lớn và so sánh thời gian với SAN cũ chưa? Đây có phải là loại đèn flash giống như SAN cũ? Còn cách bố trí các tập và chia sẻ chúng với các ứng dụng hoặc máy chủ khác thì sao?
Alen

1
Và bạn có cùng mức độ phân tách giữa cơ sở dữ liệu, nhật ký và tempdb trên mảng mới không? Điểm kiểm tra đóng sập các tệp cơ sở dữ liệu, nhưng có thể xung đột với các IO khác trên các ổ đĩa đó.
David Browne - Microsoft

Câu trả lời:


1

Hừm. Bạn hiển thị các khoảng thời gian chờ đợi trong điểm kiểm tra, nhưng không phải là chờ đợi trung bình / tổng hợp trong bao lâu (mà, thành thật mà nói, sẽ là tất cả những gì tôi quan tâm). Thực hiện phân tích thống kê chờ vi sai để xem liệu thời lượng có đáng quan tâm không. Ngoài ra, chính xác hai chờ đợi trong biểu đồ của bạn là gì? Nếu bạn đang nhận được rất nhiều cấp bộ nhớ, hãy chờ với 1TB RAM khi chơi, chúng ta cần có một cuộc thảo luận khác. : -D

Tốc độ ghi 125 MB trong điểm kiểm tra: đó là điểm kiểm tra CHỈ ghi hay TẤT CẢ? Dù bằng cách nào, nó có vẻ thấp đối với lưu trữ toàn flash. Bạn có điểm chuẩn cho biết lưu trữ cho các mẫu ghi khác nhau và nếu vậy bạn đã nhận được những gì các cựu sinh viên?


0

Chúng tôi không chắc chắn lý do tại sao hành vi của SQL Server của chúng tôi thay đổi (và chúng tôi có bằng chứng xảy ra trước khi chuyển đổi lưu trữ), nhưng việc kích hoạt các điểm kiểm tra gián tiếp cho DB người dùng đã khắc phục sự cố cho chúng tôi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.