Hôm nay, khách hàng đã có quyền xóa dữ liệu của họ và tiếp tục một cuộc nói chuyện thú vị về dữ liệu được sao lưu (chúng tôi có một cửa sổ 93 ngày để sao lưu trên AWS s3)
Tôi đã tự hỏi nếu / làm thế nào bất cứ ai ngoài đó đi về xóa dữ liệu khách hàng trong các bản sao lưu? Có vẻ như hành động bảo vệ dữ liệu này cũng bao gồm dữ liệu được sao lưu?
Làm thế nào để bạn giải quyết vấn đề này trong các tình huống như của tôi, nơi chúng tôi có tệp sao lưu hàng đêm 73 GB được tạo mỗi ngày (mở rộng lên 589GB dữ liệu và 117GB tệp nhật ký) vì vậy về mặt lý thuyết nếu điều này có thể thực thi đầy đủ và bao gồm các bản cập nhật thì chúng tôi cần khôi phục 93 sao lưu nó sẽ mất:
Khôi phục sao lưu - 3 giờ
Xóa dữ liệu khách hàng - 1 phút - 2 giờ (tùy thuộc vào cách sử dụng)
Sao lưu 50 phút
(Tôi đánh giá cao rằng mặc dù đây là một cơ sở dữ liệu lớn đối với tôi, làm việc trong một công ty nhỏ, nhưng điều này vẫn còn nhỏ so với các doanh nghiệp!)
Vì vậy, nếu chúng tôi tạo một ứng dụng tự động làm điều này, sẽ mất tối thiểu [4 giờ cho mỗi lần sao lưu] * 93 = 372 giờ (15 ngày rưỡi!) Xử lý (trên một máy chủ riêng biệt, vì vậy chúng tôi không ảnh hưởng hệ thống sống của chúng tôi)
May mắn thay, chúng tôi chưa có yêu cầu như thế này, nhưng mối quan tâm khác của tôi về vấn đề này là, nếu người viết kịch bản xóa dữ liệu vô tình xóa một phần dữ liệu của ai đó, giờ đây chúng tôi không có bản sao lưu để sao lưu! Chắc chắn điều này sẽ đi ngược lại SLA của bạn sao lưu?
Tôi mong muốn được nghe quan điểm của mọi người và bất kỳ bằng chứng nào của pháp luật về điều này?