SQL Server 2012 Trang Tuổi thọ được đặt lại về 0 sau khoảng 50 ngày


12

Tôi đã nhận thấy một hành vi kỳ quặc trên cụm HA 2 máy chủ và tôi hy vọng ai đó có thể xác nhận sự nghi ngờ của tôi hoặc có thể đưa ra một số lời giải thích khác ... Đây là thiết lập của tôi:

  • Cài đặt SQL 2012 SP1 2 máy chủ
  • SQL Luôn luôn HA đã được kích hoạt cho một vài cơ sở dữ liệu
  • CPU là 2,4 GHz, 4 nhân
  • RAM là 34 GB (là phiên bản AWS, do đó là số lẻ)
  • Việc sử dụng tài nguyên tương đối thấp - mỗi máy chủ có hơn 14 GB bộ nhớ và SQL không giới hạn số lượng bộ nhớ sử dụng
  • Thời gian truy cập đĩa ổn - hiếm khi vượt quá 15ms / Đọc hoặc Ghi
  • Cơ sở dữ liệu không lớn - 1 GB, 1,5 GB, 7,5 GB
  • Quá trình máy chủ SQL đang sử dụng 16 GB byte riêng, Bộ làm việc 15 GB

Nhìn chung, không có vấn đề tài nguyên được ghi nhận. Bây giờ cho phần lẻ. SQL không được khởi động lại (quá trình đã chạy được gần 6 tháng) nhưng dường như cứ sau ~ 50 ngày, bộ đếm Tuổi thọ của Trang giảm xuống (gần như) 0. Cho đến thời điểm đó nó tăng dần đều, không giảm. Đây là một biểu đồ hoàn hảo:

nhập mô tả hình ảnh ở đây

Khi tôi xem dữ liệu của bộ đếm (tôi không có số chính xác, chỉ là tổng hợp hàng giờ), có vẻ như giá trị bộ đếm PLE đạt khoảng 4.295.000 giây (khoảng 50 ngày) mỗi lần (ít nhất là mỗi lần tôi có dữ liệu).

Giả thuyết điên rồ của tôi là số PLE được giữ dưới dạng mili giây dưới dạng int dài không dấu (có giới hạn 4.294.967.295) và sau 49,71 ngày, nó đặt lại, do thiết kế hoặc do lỗi. Điều này sẽ giải thích hành vi của hai máy chủ và mô hình giống hệt nhau mà họ có. Hoặc nó có thể là một cái gì đó hoàn toàn khác và tôi chỉ không có ý nghĩa gì. :)

Có ai nhìn thấy bất cứ điều gì như vậy, hoặc có thể giải thích hành vi này?

PS tôi thấy bài này , nhưng trường hợp của tôi có vẻ hơi khác.

PPS Đây là một repost - ban đầu tôi đã đăng nó ở đây , nhưng được khuyên khán giả ở đây là phù hợp hơn.

Cảm ơn!


Bình luận không dành cho thảo luận mở rộng; cuộc trò chuyện này đã được chuyển sang trò chuyện .
Paul White 9

Câu trả lời:


3

Tôi đã thấy hành vi này trên một trang web khách chạy SQL2012 SP1. Các chi tiết cụ thể ở đây là NUMA và PLE thể hiện mô hình 'răng cưa' nhưng theo chu kỳ hàng giờ.

Một vài luồng trên SQLServerCentral đã thảo luận xung quanh vấn đề này:

http://www.sqlservercentral.com/Forums/Topic1415833-2799-1.aspx http://www.sqlservercentral.com/Forums/Topic1424826-2799-1.aspx

kết quả cuối cùng là việc áp dụng SP1 CU4 dường như đã khắc phục được sự cố.

CU4 chứa bản sửa lỗi trông ngây thơ Một bản cập nhật có sẵn cho SQL Server 2012 Quản lý bộ nhớ KB2845380

Đáng thử?


Cảm ơn bạn đã đăng bài này (xin lỗi vì đã trả lời chậm trễ, vì một số lý do tôi không bao giờ nhận được thông báo về bài đăng của bạn). Tôi đã xem qua các liên kết - chúng trông hơi giống nhau, vì vậy tôi sẽ cố gắng sao chép thiết lập trong QA, áp dụng CU4 (hoặc thậm chí có thể đi thẳng đến SP2), sau đó kiểm tra lại. Với tốc độ tôi thấy điều này (cứ sau 50 ngày) sẽ mất một lúc trước khi tôi có thể xác nhận, nhưng tôi sẽ đăng lại khi tôi có kết quả. BTW, mô hình của tôi vẫn giữ - leo ổn định trong ~ 50 ngày, sau đó giảm mạnh xuống ~ 0 và leo lại - tổng cộng 4 kể từ khi dịch vụ được bắt đầu vào tháng 12.
CRCerr0r

Cập nhật ... Tôi đã xác nhận điều này trong môi trường QA của chúng tôi. Các số liệu thống kê tôi nhận được từ đó là: Tổng số ngày giữa các lần đặt lại - 49,71 (+/- 1 phút); Giá trị PLE tối đa đạt - 4.294.961 (sau 1 phút mẫu, do đó, nó có thể cao hơn một chút). Điều đó khá nhiều xác nhận các quan sát sản xuất. Tôi sẽ áp dụng CU4 và báo cáo lại sau ~ 50 ngày ... :)
CRCerr0r

1
Bất kỳ tin tức về điều này?
Michael Green
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.