Tôi đã nhận thấy một hành vi kỳ quặc trên cụm HA 2 máy chủ và tôi hy vọng ai đó có thể xác nhận sự nghi ngờ của tôi hoặc có thể đưa ra một số lời giải thích khác ... Đây là thiết lập của tôi:
- Cài đặt SQL 2012 SP1 2 máy chủ
- SQL Luôn luôn HA đã được kích hoạt cho một vài cơ sở dữ liệu
- CPU là 2,4 GHz, 4 nhân
- RAM là 34 GB (là phiên bản AWS, do đó là số lẻ)
- Việc sử dụng tài nguyên tương đối thấp - mỗi máy chủ có hơn 14 GB bộ nhớ và SQL không giới hạn số lượng bộ nhớ sử dụng
- Thời gian truy cập đĩa ổn - hiếm khi vượt quá 15ms / Đọc hoặc Ghi
- Cơ sở dữ liệu không lớn - 1 GB, 1,5 GB, 7,5 GB
- Quá trình máy chủ SQL đang sử dụng 16 GB byte riêng, Bộ làm việc 15 GB
Nhìn chung, không có vấn đề tài nguyên được ghi nhận. Bây giờ cho phần lẻ. SQL không được khởi động lại (quá trình đã chạy được gần 6 tháng) nhưng dường như cứ sau ~ 50 ngày, bộ đếm Tuổi thọ của Trang giảm xuống (gần như) 0. Cho đến thời điểm đó nó tăng dần đều, không giảm. Đây là một biểu đồ hoàn hảo:
Khi tôi xem dữ liệu của bộ đếm (tôi không có số chính xác, chỉ là tổng hợp hàng giờ), có vẻ như giá trị bộ đếm PLE đạt khoảng 4.295.000 giây (khoảng 50 ngày) mỗi lần (ít nhất là mỗi lần tôi có dữ liệu).
Giả thuyết điên rồ của tôi là số PLE được giữ dưới dạng mili giây dưới dạng int dài không dấu (có giới hạn 4.294.967.295) và sau 49,71 ngày, nó đặt lại, do thiết kế hoặc do lỗi. Điều này sẽ giải thích hành vi của hai máy chủ và mô hình giống hệt nhau mà họ có. Hoặc nó có thể là một cái gì đó hoàn toàn khác và tôi chỉ không có ý nghĩa gì. :)
Có ai nhìn thấy bất cứ điều gì như vậy, hoặc có thể giải thích hành vi này?
PS tôi thấy bài này , nhưng trường hợp của tôi có vẻ hơi khác.
PPS Đây là một repost - ban đầu tôi đã đăng nó ở đây , nhưng được khuyên khán giả ở đây là phù hợp hơn.
Cảm ơn!