Tôi bắt đầu thấy các máy khách có hàng trăm terabyte dữ liệu (trong bản cài đặt SQL Server). Khi tổng khối lượng dữ liệu trong một số doanh nghiệp tiếp cận các phân số có ý nghĩa của một petabyte, tôi muốn đưa ra cơ sở kiến thức tập thể ngoài kia để xem mọi người xử lý mức độ dữ liệu đó đang làm gì để bảo vệ dữ liệu đó.
Vấn đề rõ ràng là việc lưu trữ nhiều bản sao lưu của nhiều dữ liệu đó rất tốn kém, sử dụng lưu trữ cấp doanh nghiệp, quái, thậm chí chỉ là RAID-5.
Các tùy chọn tôi thấy như sau:
- Tạo một bản sao phản chiếu của dữ liệu trong một trung tâm dữ liệu khác và liên tục gửi các khác biệt cho nó (sử dụng bất kỳ cơ chế nào có sẵn cho nguồn dữ liệu của bạn - ví dụ: vận chuyển log hoặc phản ánh cơ sở dữ liệu với SQL Server)
- Thực hiện sao lưu thường xuyên bằng thuật toán nén khổng lồ (có lẽ chỉ phù hợp nếu dữ liệu tự cho vay tốt để được nén nhiều )
- Hãy sao lưu từng phần của các phần quan trọng / thay đổi của dữ liệu.
- Đừng sao lưu dữ liệu và tin vào các vị thần tham nhũng.
Tôi đang thấy tùy chọn số 4 được chấp nhận là mặc định và là một chuyên gia HA / DR, điều đó thực sự đáng sợ, nhưng tôi khuyên gì thay thế? Tôi nghĩ rằng # 1 là cách tiếp cận tốt nhất, nhưng "Tôi không nghĩ vậy" là câu trả lời thông thường khi có bất kỳ lựa chọn thay thế nào ngoài # 4 và có thể # 3 được đề xuất.
Bây giờ, tất nhiên nó phụ thuộc vào tốc độ thay đổi và mức độ quan trọng của dữ liệu. Không cần phải trả lời vì tôi đã từng chịu trách nhiệm về tất cả các tính năng HA của SQL Server khi tôi làm việc tại Microsoft nên tôi rất thành thạo trong các đối số 'nó phụ thuộc' - đó là cụm từ dễ hiểu của tôi :-)
Tôi rất muốn nghe về bất kỳ lựa chọn thay thế nào tôi đã bỏ lỡ, hoặc nghe nói rằng mọi người khác đều ở trong cùng một chiếc thuyền và không có sự thay thế thực tế nào để chi nhiều tiền cho việc lưu trữ nhiều hơn.
Cảm ơn trước - tín dụng đáo hạn sẽ được trao cho tất cả các câu trả lời được suy nghĩ kỹ lưỡng và bày tỏ.