Tôi đang thực hiện tính toán 'mặt sau của phong bì' để thiết lập cơ sở dữ liệu báo cáo 100TB. Tôi đang tìm kiếm suy nghĩ từ các chuyên gia ở đây. Môi trường đề xuất:
- Dung lượng lưu trữ ~ 100TB
- Bảng ~ 200, kích thước từ 1GB đến 5TB. kích thước trung bình có thể nằm trong khoảng từ 100GB đến 200GB
- ETL - các công việc có thể yêu cầu nối giữa các bảng của 10 triệu hàng, với các khóa tham gia từ 10 byte đến 500 byte. tham gia như vậy sẽ kết thúc trong dưới 2-5 phút
- Chọn trực tiếp - ban đầu, chỉ quan tâm đến tốc độ chọn. nên hỗ trợ 500 lượt chọn / giây. Cập nhật / giây sẽ là số tương đối nhỏ hơn nhiều và có thể bỏ qua cho bài tập này.
- cần sẵn sàng 24x7. Cần có sẵn 2 máy chủ DB độc lập để phục vụ các cuộc gọi chọn lọc (với dữ liệu được sao chép).
Câu hỏi:
- Hiện tại, tôi đang xem xét Oracle. Kinh nghiệm của bạn như thế nào với các giải pháp mã nguồn mở thương mại (hoặc) khác cho cơ sở dữ liệu lớn?
- Bạn đã thấy hệ điều hành phần cứng nào hoạt động tốt nhất? Tôi đang lên kế hoạch cho Linux trên Dell.
- Lưu trữ mạng, chẳng hạn như NetApp, là phải? Những vấn đề bạn thấy trước với việc sử dụng thương mại ra khỏi các đĩa kệ?
- Khi phần cứng và HĐH đã sẵn sàng, bạn sẽ dành bao nhiêu thời gian để thiết lập, định cấu hình DB, lưu trữ, v.v.
- Thành phần nhóm nào hoạt động tốt nhất trong môi trường bạn đã quan sát? Ý tôi là, các Quản trị viên khác nhau (Quản trị viên hệ điều hành, Quản trị viên Oracle DB?) Cần có để quản lý và vận hành một thiết lập như vậy. Có bao nhiêu trong số chúng có thể cần thiết để đạt được thời gian hoạt động 24x7.
- Bất kỳ xấp xỉ / phạm vi trên Giấy phép DB, chi phí lưu trữ mạng.
Tôi biết tôi không có tất cả các chi tiết môi trường. Tôi không tìm kiếm chi tiết chính xác, một xấp xỉ là đủ. Mặc dù một số câu hỏi có thể được trả lời tốt nhất bởi các nhà quản lý, tôi quan tâm đến quan điểm của Quản trị viên. Tôi đánh giá cao đầu vào của bạn.