Đề xuất thiết kế cơ sở dữ liệu máy chủ SQL lớn


8

Chúng tôi đang tạo một cơ sở dữ liệu trong Tiêu chuẩn MSSQL 2008 R2, nơi chúng tôi sẽ lưu trữ một số lượng lớn các bản ghi. Chúng tôi ước tính 200 triệu + hồ sơ trong một bảng hàng năm và chúng tôi chủ yếu CHỨNG MINH với rất ít CẬP NHẬT hoặc XÓA trên dữ liệu. Đây là một hệ thống lưu trữ dữ liệu, nơi chúng tôi chèn các hồ sơ lịch sử hàng ngày. Chúng tôi sẽ tạo ra các loại báo cáo khác nhau về hồ sơ lịch sử này theo yêu cầu của người dùng để chúng tôi có một số lo ngại và yêu cầu tư vấn và đầu vào kỹ thuật.

  • Cách tốt nhất để quản lý loại bảng lưu trữ và cơ sở dữ liệu này là gì?

1
Nếu bạn đang thiết kế một cơ sở dữ liệu lớn (hoặc một cơ sở dữ liệu lớn cho bạn) thì điều quan trọng là phải có được nhận thức ngay từ đầu và cách tốt nhất để làm điều đó là thuê một chuyên gia cơ sở dữ liệu đã làm việc với các cơ sở dữ liệu mà bạn đang nói đến . Điều này quan trọng hơn việc thuê các nhà phát triển ứng dụng.
HLGEM

Câu trả lời:


12

Đây là ý kiến ​​của tôi:

  1. Nếu bạn đang có rất ít cập nhật / xóa, bạn có thể tăng hệ số lấp đầy trang lên 95%. Điều này sẽ tiết kiệm không gian và đọc. Làm một số thử nghiệm mặc dù.
  2. Phân vùng bảng dựa trên một danh mục rộng như năm.
  3. Đặt các phân vùng trên các nhóm khác nhau.

7

200 triệu hàng mỗi năm không đặc biệt lớn (trừ khi các hàng lớn bất thường). Bạn cần chú ý đến các nguyên tắc thiết kế cơ sở dữ liệu âm thanh (chuẩn hóa) và sử dụng các tính năng tiêu chuẩn như lập chỉ mục và phân vùng. Rõ ràng phần cứng đúng cũng quan trọng.

Không có đủ thông tin ở đây để đưa ra lời khuyên cụ thể. Cân nhắc việc thuê ai đó nếu bạn cảm thấy cần giúp đỡ về thiết kế và thực hiện chi tiết.


Cảm ơn cho đầu vào của bạn. chúng tôi đã áp dụng các nguyên tắc thiết kế mà bạn đang đề cập nhưng sẽ hoạt động lập chỉ mục sau khi phần phát triển hoàn tất. Tôi đoán để phân vùng bạn cần giấy phép Doanh nghiệp và chúng tôi có giấy phép phiên bản Chuẩn vào lúc này.
kodvavi

6
  • Hãy chắc chắn rằng thiết kế của bạn làm cho phần chèn của bạn luôn ở cuối bảng. Gợi ý cụm chỉ số.

  • Chỉ có rất ít chỉ mục không bao gồm hỗ trợ các báo cáo bạn cần làm để tiếp tục duy trì chúng ở mức tối thiểu. Là những báo cáo được phát hành trước? nếu có thì hãy xem xét câu hỏi này: Có ổn không nếu báo cáo mất 2 giờ để tạo? (không có chỉ mục) hoặc 1mins (có chỉ mục). Có lẽ không sao để báo cáo mất 2 giờ để có một chỉ số ít hơn? hoặc có thể không? Nếu báo cáo không được ưu tiên tốt thì đó là một câu hỏi khác vì người dùng không muốn chờ đợi và bạn có thể cần triển khai thêm các chỉ mục để hỗ trợ báo cáo của mình.

  • Từ cách bạn mô tả cơ sở dữ liệu này, có vẻ như bạn đang mong đợi rất nhiều hàng và dữ liệu sẽ thêm và phát triển rất nhiều. Bạn đã xem xét làm thế nào để sao lưu hệ thống này? Tôi thấy hầu hết dữ liệu sẽ giống nhau và chỉ cần thêm mới? Tôi không biết các yêu cầu kinh doanh của hệ thống này nhưng với tôi có vẻ như trong một hoặc hai năm, đây có thể là một cơ sở dữ liệu có kích thước đáng kể và bạn có thể gặp khó khăn khi thực hiện nhiều bản sao lưu đầy đủ. Cân nhắc thực hiện sao lưu toàn bộ với định kỳ (hàng tuần?) Và chênh lệch (hàng ngày?) Và nhật ký giao dịch (hàng giờ?). Theo như tôi đã nói tôi không biết các yêu cầu kinh doanh có thể bạn không cần tất cả các bản sao lưu mọi lúc? Kích thước có thể là một vấn đề trong các hệ thống lưu trữ.


1
Cảm ơn martin cho đầu vào của bạn. Trên thực tế, db chứa số liệu thống kê và hồ sơ lịch sử về các sản phẩm nông nghiệp. Sự tăng trưởng là đáng kể và đầu vào của bạn về sao lưu là hữu ích. Chúng tôi đã lên kế hoạch cho thói quen sao lưu và đầu vào của bạn đã thêm một số giá trị lớn. Quá trình sao lưu hiện tại của chúng tôi cho cơ sở dữ liệu khác nhau có cách tiếp cận tương tự. Sự khác biệt hàng ngày và sao lưu đầy đủ hàng tuần.
kodvavi

1
Thiết kế btw gần như là cuối cùng và chúng tôi đang sử dụng SSRS để báo cáo các yêu cầu và công việc của nó rất tốt nhưng chúng tôi vẫn tinh chỉnh và tăng hiệu suất trước khi đi vào sản xuất.
kodvavi
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.