Bối cảnh:
Tôi có một bảng thực tế trong UAT Phase. Mục tiêu tải 5 năm dữ liệu trong Prod (kích thước dự kiến 400 Mn hồ sơ). Hiện tại nó chỉ có 2 năm dữ liệu trong Test.
Tính năng bảng:
- Không có kích thước ~ 45
- Các biện pháp ~ 30
- Các biện pháp không phụ gia và các cột khác ~ 25
- Kích thước dữ liệu hiện tại ~ 200 triệu (dữ liệu 2 năm)
- Chế độ xem thời gian: 3 chế độ xem theo tháng khác nhau: Tài chính / Lịch / Điều chỉnh (nghĩa là cùng một hàng có thể rơi vào các tháng khác nhau dựa trên chế độ xem mà người đó đang tìm kiếm)
- Chỉ một chế độ xem sẽ được yêu cầu tại một thời điểm bởi người dùng. (ví dụ: chỉ một Cột Tháng sẽ được sử dụng trong truy vấn, điều đó ngăn chúng tôi thực hiện phân vùng theo chế độ xem thời gian)
- Chỉ mục: 1 Chỉ mục được nhóm trên các khóa tự nhiên (8 cột). Đã tạo 3 chỉ số bao gồm các chỉ mục không được phân cụm một trên mỗi cột trong tháng, bao gồm một vài SK chiều (FK) và tất cả các biện pháp).
- Chỉ số rất lớn (tổng cộng 190 GB) vì điều này.
- Không gian không hạn chế (phân bổ 1 TB)
- 64 GB RAM có sẵn trong máy chủ.
- Nén bảng cũng được thực hiện.
Yêu cầu:
Các truy vấn trên bảng Fact này sẽ cho kết quả trong vòng 30 giây (Truy vấn chung chọn tổng (số đo) tham gia vài nhóm Dims theo Dim Values). Các báo cáo được thực hiện trực tiếp trên đầu bảng Fact này.
Vấn đề:
Bất kỳ truy vấn nào bao gồm các cột có sẵn trong Chỉ mục đều hoạt động tốt, nhưng nếu chúng tôi bao gồm bất kỳ cột nào khác không có trong .. Nó rất tệ. Phải mất hơn 5-10 phút. Bất kỳ ai có thể đề xuất một số giải pháp mà nó hoạt động tốt cho bất kỳ thứ nguyên / cột nào chúng tôi chọn. Index có thể giúp đỡ trong tình huống này?