Làm cách nào để định cấu hình các đĩa này trên Máy chủ SQL cho cấu hình BI?


8

Giả sử bộ nhớ không đổi (32gb) và CPU (4), 2 x mảng đĩa, tôi có các đĩa sau

  • 2 x 150 (10k)
  • 6 x 150 (15k)

Chúng là tất cả các đĩa cục bộ.

Yêu cầu của tôi

  • DB của tôi là 350gb và được đặt ở mức tăng trưởng 10% mặc định
  • Hệ điều hành & Máy chủ SQL của tôi là Máy chủ 2k8R2 (C: ổ đĩa OS + trang + ứng dụng = 55Gb)
  • Yêu cầu nhật ký là khoảng 70gb và được đặt thành tăng trưởng 10% mặc định và được cắt ngắn thường xuyên
  • TempDb của tôi hiện có dung lượng khoảng 12gb và được đặt ở mức tăng trưởng 10% mặc định

Vấn đề của tôi là tôi đang cố gắng tìm nơi tốt nhất để đặt TempDB và HĐH và Nhật ký. Kinh nghiệm của tôi bị hạn chế trong cấu hình tối ưu của hai

Đây không phải là một hệ thống giao dịch trực tuyến. Nó có dữ liệu nặng ghi (dữ liệu mới + lập chỉ mục xây dựng lại / reorg) sau đó đọc dữ liệu nặng (tôi ước tính khoảng 50/50) xử lý trong khoảng 13 giờ, và sau đó chỉ im lặng.

Tôi hiểu rằng TEMPDB được sử dụng nhiều trong quá trình xử lý thông thường so với nhật ký.

Ý tưởng của tôi là như sau

  • 2 x 150g (15k) Raid 1 = 150g cho HĐH + TempDB
  • 2 x 150g (10k) Raid 1 = 150g cho LOG (lưu ý các đĩa chậm hơn ở đây)
  • 4 x 150g (15k) Raid 5 = 150g cho dữ liệu

Ý tưởng đó nghe không hấp dẫn sao? Sau đó tôi có thể trao đổi Log + TempDB nếu cần.

Tôi có vi phạm các quy tắc chính yếu như không bao giờ đặt TempDB trên đĩa hệ điều hành do lo ngại phân trang hay có lẽ không bao giờ đặt nhật ký trên đĩa chậm hơn dữ liệu ?

Biên tập:

Chúng tôi cũng có SSAS trên hệ thống và người dùng cuối chỉ truy cập Cube. 50% đọc ở trên dựa trên thời gian cần thiết để xử lý cơ sở dữ liệu SSAS.

Câu trả lời:


7

2 * 10k RAID1 cho HĐH, 6 * 15k RAID10 cho mọi thứ khác. Thành thật mà nói, với nhiều đĩa này, 1 mảng là đặt cược an toàn nhất và thường nhanh nhất.

Nếu bạn đã có thời gian để kiểm tra và có một thế giới thực, khối lượng công việc có thể lặp lại, có thể đo được thì bằng mọi cách hãy chạy thử với tempdb của bạn trên ổ đĩa hệ điều hành (caveat: giới hạn sự phát triển tệp tempdb để đảm bảo bạn không làm hỏng hệ điều hành) . Lật mặt, bạn có thể thấy những cải thiện vừa phải đối với tải dữ liệu và bảo trì của bạn với nhật ký ở đó thay vì đáng để chạy thử hoặc hai nếu thời gian cho phép.


Có bất cứ điều gì để có thêm mảng? TempDB không nên nằm trong một mảng / trục chính riêng biệt? Tôi đang ước tính 50/50 vì nó dựa trên xử lý 50% DW và 50% SSAS (6 giờ đọc).
Tăng trước

Tôi thấy không đề cập đến một khối dịch vụ phân tích trong câu hỏi ban đầu của bạn. Cả cơ sở dữ liệu quan hệ và khối được truy vấn bởi người dùng cuối hay chỉ là khối?
Mark Storey-Smith

1
+1 Tôi thích đề xuất của bạn. Điều đáng chú ý là nếu anh ta đặt tempdb trên ổ đĩa hệ điều hành thì chắc chắn giới hạn kích thước tối đa cho các tệp cơ sở dữ liệu. Tất cả chúng ta có thể đồng ý rằng chúng tôi không muốn các tệp cơ sở dữ liệu giả mạo điền vào ổ đĩa cụ thể đó.
Thomas Stringer

1
@PreetSangha Niềm tin không phải là một cơ sở tuyệt vời để lên kế hoạch triển khai máy chủ hoặc lưu trữ. Bạn cần đầu tư một chút thời gian để nghiên cứu và hiểu lý do tại sao điều đó phù hợp trong một số tình huống chứ không phải những tình huống khác. Tách khối của bạn khỏi cơ sở dữ liệu quan hệ có thể có chân ở đây nhưng ai có thể biết mà không cần kiểm tra nó. Không có gì khó và nhanh, một kích thước phù hợp với tất cả, cách tiếp cận của JFDI đối với điều này tôi sợ.
Mark Storey-Smith

2
Nếu bạn có thể kiểm tra và đo lường các kịch bản khác nhau với khối lượng công việc của mình, nó có thể được chứng minh là đúng chỗ. Khi / nếu bạn không thể, một nhóm lớn lưu trữ càng nhanh càng tốt sẽ hấp thụ các khối u và va đập tốt hơn so với một cú bắn trong bóng tối. Hãy thoải mái tham gia vào cuộc trò chuyện nếu bạn muốn nảy ý tưởng xung quanh. Có một số quy tắc có nhiều kinh nghiệm SSAS hơn tôi có thể có các đề xuất để xác định cách thức / nếu bạn nên tách khối từ cơ sở dữ liệu.
Mark Storey-Smith

3

Tôi đồng ý với Mark rằng cách tiếp cận lý tưởng là đặt hai ổ đĩa chậm hơn trong RAID 1 chỉ cho O / S và phần còn lại của ổ đĩa trong RAID 10 cho mọi thứ khác. Đó sẽ là lý tưởng.

Tuy nhiên, dựa trên các kích thước bạn đã đưa ra, điều này khá nhiều cho bạn bắt đầu, với rất ít sai sót và không có chỗ cho sự phát triển. Và nhân tiện, nếu ai đó nói với bạn rằng các ổ đĩa là 150 GB, chúng thực sự có thể nhỏ hơn thế (146 GB?), Không được định dạng, điều đó có nghĩa là không phải mọi thứ sẽ phù hợp với con dơi.

Thật không may, khối lượng công việc liên quan đến việc ghi nhiều và vì thế, RAID 5 ... không phải là bạn của bạn.

Nếu bạn có thể quản lý để thay đổi một chút ngân sách, có một số cách tiếp cận:

  • Thêm hai ổ 15k cùng kích cỡ. Tùy thuộc vào "2 x mảng đĩa" nghĩa là gì,> tổng số 8 ổ đĩa có thể có nghĩa là cần một bộ điều khiển RAID mới. (Và / hoặc khung lớn hơn, có thể.)

  • Hai ổ SSD ~ 120 GB (PCI-express hoặc SATA) trong phần mềm RAID 1 cho dữ liệu / nhật ký TempDB và tệp nhật ký cơ sở dữ liệu. Đây thực sự có thể là giải pháp, thời gian nhanh nhất và có thể có giá thấp hơn đáng kể so với 2 ổ đĩa 15k cấp doanh nghiệp (chứ chưa nói đến bộ điều khiển RAID có thể so sánh được). Giả định này có các khe / cổng có sẵn trên bo mạch chủ, có lẽ có.

Nếu quản lý không chuyển sang ngân sách (tình huống này có vẻ như phần cứng cũ đang được sử dụng lại cho dự án mới ... có nghĩa là ngân sách bằng 0), bạn sẽ phải sử dụng RAID 5 vì lý do không gian, vì không có cách để tránh nó mà không có nhiều đĩa có sẵn. Tại thời điểm đó, cách tốt nhất có lẽ là đưa 2 đĩa chậm hơn vào RAID 1 chỉ cho O / S và phần còn lại trong RAID 5 để tối đa hóa không gian. Nếu bạn buộc phải sử dụng RAID 5 cho bất kỳ phần nào trong số này, ban quản lý phải đăng xuất (bằng văn bản) để hiểu điều đó có nghĩa gì về mặt hiệu suất.


Cảm ơn bạn. Đây là máy chủ của khách hàng nên họ sẽ đưa ra quyết định cuối cùng nhưng chúng tôi chấp nhận rằng các sọc dự phòng lớn nhanh là điều tốt nhất chúng ta nên hướng tới. Máy chủ của chúng tôi sử dụng sọc SSD lớn.
Tăng
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.