Tôi vẫn cần một bản sao lưu nếu tôi có một hệ thống lưu trữ dự phòng với khả năng rollback?


32

Tổ chức của tôi gần đây đã mua một hệ thống lưu trữ. Nó có 1.5Petabyte, với RAID6 và có một máy nhân bản được đồng bộ hóa trực tuyến ở một vị trí khác.

Hệ thống cho phép khôi phục rollback / file, theo mặc định cho phép tối đa 30 ngày nhưng điều này có thể tăng lên.

Có một cuộc thảo luận đang diễn ra nếu chúng ta cần một số loại sao lưu bổ sung cho dữ liệu chỉ sống trên bộ lưu trữ.

Hệ thống này có mức độ dự phòng rất tốt, nó có độ dự phòng địa lý và cho phép khôi phục đến một mức độ nào đó, điều đó có nghĩa là chúng tôi có thể khôi phục đến thời gian xác định (30 ngày theo mặc định) dữ liệu cũ hoặc dữ liệu vô tình bị xóa.

Với kịch bản này, nó vẫn có ý nghĩa để có một bản sao lưu "truyền thống"? Theo truyền thống, tôi có nghĩa là một hệ thống sao lưu chuyên dụng, với các ảnh chụp nhanh mà chúng ta có thể truy xuất trong trường hợp có sự cố.

chúng ta có thực sự cần nó không? Tui bỏ lỡ điều gì vậy? Có phải tôi chỉ suy nghĩ theo cách truyền thống và quá nhiệt tình?


Nếu nó cũng cho phép bạn sao chép các ảnh chụp nhanh sang một thiết bị khác thì bạn có thể khắc phục các vấn đề mà Sven đề cập trong câu trả lời của anh ấy.
Drind104

4
Chắc chắn có liên quan, nhưng có lẽ không phải là một bản sao hoàn toàn do phân tách địa lý và khả năng khôi phục ảnh chụp nhanh: Tại sao RAID không phải là bản sao lưu?
một CVn

Miễn là bạn cũng xóa phím "xóa" khỏi mọi bàn phím tại chỗ, bạn là vàng ;-)
Tom Newton

1
Chắc chắn tốt hơn là không có điều đó. Tôi vẫn muốn các bản sao lưu sống trên một phương tiện tránh xa "lỗi người". Tuy nhiên, bạn biết câu trả lời cho câu hỏi của mình, nhưng nó liên quan đến việc đưa ra giá cho dữ liệu của bạn. Chúc may mắn.
Tom Newton

7
Khả năng "rollback" của bạn cũng bao gồm các thay đổi về âm lượng? Ví dụ, liệu nó có thể phục hồi nếu ai đó loại bỏ tất cả khối lượng không?
vhu

Câu trả lời:


40

Những gì bạn mô tả là cần thiết một RAID phân phối theo địa lý và RAID không bao giờ là bản sao lưu .

Đồng bộ hóa trực tuyến thường có nghĩa là mọi thứ bạn làm trên bộ lưu trữ chính sẽ được sao chép ngay lập tức vào hệ thống sao lưu, bao gồm các thao tác như xóa (tất cả) ảnh chụp nhanh và / hoặc khối lượng của kẻ tấn công hoặc đơn giản là lỗi quản trị viên.


3
Hoặc, vì cả hai kho lưu trữ có thể sử dụng cùng một hệ điều hành, một lỗi phần mềm có thể phá hủy dữ liệu. Không có khả năng, một lỗi quản trị có thể xảy ra hơn, nhưng có thể.
Sunzi

8
Thật. Mục tiêu là không ai có thể quản lý các ảnh chụp nhanh tự động. Điều đó sẽ cho mức độ kiên cường chống lại sai lầm. Tất nhiên người ta cũng có thể xóa một bản sao lưu do nhầm lẫn.
nsn

2
@nsn có nhiều lỗi tương quan khác như lỗi trong phần mềm thiết bị hoặc lỗi trong tập lệnh quản lý của bạn. Không có một bản sao lưu ở một nơi nào khác, bạn đang giao phó công việc của mình cho nhà cung cấp ... Bạn có sẵn sàng làm điều đó không? Cũng định lượng thiệt hại trong trường hợp mất mát. Có thể câu trả lời phụ thuộc vào giá trị của dữ liệu. Là công ty đi mà không có nó?
usr

2
@ nsn > Tất nhiên người ta cũng có thể xóa một bản sao lưu do nhầm lẫn. < - có nhưng nó trở nên khó khăn hơn đáng kể khi sao lưu được thực hiện ngoại tuyến và được đặt trong bộ lưu trữ ngoại vi, an toàn, chẳng hạn.
Rob Moir

7

Phục hồi 30 ngày là một khả năng tuyệt vời, nhưng điều gì sẽ xảy ra nếu "quan trọng-file-xyz" bị hỏng / hỏng và điều này không được phát hiện cho đến hơn 31 ngày sau? Tình huống này là sự khác biệt giữa lịch trình sao lưu và lưu trữ, nhưng trong mô tả của bạn, cái sau không được đề cập. Hệ thống lưu trữ thường được lưu trữ trên băng chi phí rất thấp. Ngoài ra, không có thông tin nào về việc doanh nghiệp là một trong những yêu cầu có quy định hoặc các yêu cầu khác để lưu giữ dữ liệu lâu hơn 30 ngày, điều này thường xảy ra.

Nếu đây không phải là trường hợp của bạn, thì bạn nên làm tốt.


3
Vâng đúng. 30 chỉ là mặc định chúng ta có thể đặt các giá trị khác. Dù sao, lưu trữ ngoại tuyến cũng tốn tiền và không gắn bó mãi mãi. Sẽ luôn có một ngày n + 1
nsn

2
Tôi muốn có 30 ngày, cộng với hàng tháng cho năm ngoái, cộng với một năm. Tôi đã có một số tệp (quan trọng và cũ) biến mất và không được phát hiện trong khoảng thời gian cuộn. Các bản sao lưu hàng năm có thể là người tiết kiệm cuộc sống.
Brian Knoblauch

@BrianKnoblauch: Vâng, loại sơ đồ đó là một ý tưởng tốt, cho các ảnh chụp nhanh trực tuyến hoặc sao lưu ngoại tuyến.
Ben Voigt

6

Có máy móc tách biệt về mặt địa lý cả hai đều có dữ liệu là tốt.

Điều gì xảy ra khi bạn gặp nhiều thất bại liên quan đến cả hai hoặc tất cả các trang web của bạn? Một vụ cháy tại một, trộm máy chủ tại một? Hoặc có một vấn đề với đường giữa chúng, sau đó máy chủ của vị trí chính bị tắt và bộ điều khiển HD đi vượn và ghi rác? Hoặc một số người trong cuộc thực hiện hành vi độc hại trên cả hai? Hoặc FBI tịch thu máy chủ của bạn ở cả hai địa điểm vì nghi ngờ (bạn sẽ không bao giờ, nhưng, có thể bạn được đồng lưu trữ trong một trung tâm dữ liệu với schmucks). Hoặc .. Tôi được nhắc nhở về một số lần mất điện "đám mây" cấu hình cao, nơi mọi thứ đều dư thừa, được phân tích đến mức thứ n, nhưng, vẫn có thể mọi thứ có thể đi sai. Tôi sẽ cấp cho bạn những điều này là không thể, nhưng bạn đã thừa nhận rằng những điều không thể xảy ra.

Vì vậy, dữ liệu đó quan trọng / có giá trị như thế nào? Tổ chức sẽ làm gì nếu nó kết thúc?


3
Nếu bạn có hai vị trí và bạn mất cả hai thì có lẽ bạn cũng đã mất bản sao lưu của mình. Hầu hết câu trả lời này là một đối số để nhân rộng trên hơn hai trang web, không phải là một đối số có lợi cho việc sao lưu.
Ben

2
Điều đó đi mãi mãi. Mỗi khi bạn thêm một mức độ dư thừa, bạn luôn có thể mong đợi nó sẽ thất bại (theo địa lý hoặc chỉ là đĩa). Nếu bạn có n đĩa dự phòng, bạn luôn có thể hỏi "nếu n + 1 bị hỏng". Bạn có thể có một đám cháy trong phòng máy chủ của bạn và trong phòng dự phòng của bạn. Một công việc bên trong cũng có thể tấn công cả hai. Không có hệ thống 100% không an toàn. Điều ở đây là để biết liệu thiết lập như vậy có thể tương đương với một máy chủ "truyền thống" + sao lưu hay không
nsn

1
Tôi nghĩ rằng @nsn làm cho một điểm tuyệt vời, nhưng tôi cũng nghĩ rằng bài học từ nhiều câu trả lời này là việc sao lưu của bạn tồn tại trên một cơ sở hạ tầng công nghệ riêng biệt từ phương tiện lưu trữ của bạn là một ý tưởng tốt, bởi vì nó làm cho công nghệ khó hơn nhiều thất bại trong việc tuyên truyền, và khó hơn cho một diễn viên độc hại lây nhiễm cả hai (nhưng chỉ khó hơn). Chúng tôi thường xuyên thấy các lỗi trong các hệ thống dư thừa gây ra các tầng thất bại. Có một giải pháp khác nhau / nhà cung cấp liên quan giúp. Việc phòng ngừa rủi ro này vẫn còn tiếp diễn, nhưng tôi cho rằng mức độ phân tách công nghệ là sự thận trọng hợp lý trong hầu hết các trường hợp.
Nick

@Nick, tôi nghĩ bạn có một nhận xét rất hợp lệ. Tôi sẽ làm cho nó một câu trả lời.
nsn

4

Câu hỏi ở đây dường như là về việc bản sao dữ liệu của bạn bị ngắt kết nối và khác biệt về mặt địa lý như thế nào trước khi nó là bản sao lưu và cơ sở hạ tầng dự phòng / không sẵn có cao. Ruột của tôi là bạn đang ở gần, nhưng vẫn cần một bản sao lưu.

Để tập hợp (cherry-pick) một số suy nghĩ trong các câu trả lời và nhận xét khác, bạn có thể đi rất xa con đường "tốt, công nghệ X không bao gồm kịch bản thảm họa Y, vì vậy, nó không phải là một bản sao lưu", và tại một số điểm bạn cần phải quyết định những gì hợp lý cho bạn, đó dường như là lý do tại sao bạn hỏi. Tôi cảm thấy về điều này, và tôi nghĩ rằng cảm giác của nhiều người bình luận, là bản sao lưu của bạn cần tồn tại trên một cơ sở hạ tầng công nghệ riêng biệt với dữ liệu sử dụng của bạn để những thất bại, tai nạn và hành động độc hại không thể lan truyền hoặc có một trở ngại cao hơn nhiều để vượt qua. Một ví dụ được đưa ra trong các ý kiến ​​là một người nào đó xóa các tập, đó là một kịch bản hợp lệ, không phải là trên trời theo ý kiến ​​của tôi. Nhưng ngoài ra, một ví dụ thực tế từ công việc của tôi. Trường đại học tôi làm việc (nhưng rất may không ' t quản lý cơ sở hạ tầng này cho) có một số cơ sở hạ tầng ảo hóa có tính sẵn sàng cao hỗ trợ rất nhiều cơ sở vật chất trong khuôn viên trường. Đó là tại nhiều trang web, nhưng tất cả đều chạy trên nền tảng của một nhà cung cấp. Một lỗi khó hiểu đã xuất hiện vào một ngày gây ra sự cố thất bại lần đầu tiên đánh sập một máy chủ duy nhất, sau đó khi tải thay đổi, nó đã gỡ bỏ phần còn lại của trang web đó và sau đó khi tải lại dịch chuyển, nó đã gỡ bỏ các trang web khác lưu trữ cơ sở hạ tầng đó. (Tôi tin rằng họ đã giải quyết vấn đề này kể từ đó). Dữ liệu không bị mất trong trường hợp này, nhưng có thể tưởng tượng được một kịch bản liên quan đến dữ liệu của bạn. Một lỗi khó hiểu đã xuất hiện vào một ngày gây ra sự cố thất bại lần đầu tiên đánh sập một máy chủ duy nhất, sau đó khi tải thay đổi, nó đã gỡ bỏ phần còn lại của trang web đó và sau đó khi tải lại dịch chuyển, nó đã gỡ bỏ các trang web khác lưu trữ cơ sở hạ tầng đó. (Tôi tin rằng họ đã giải quyết vấn đề này kể từ đó). Dữ liệu không bị mất trong trường hợp này, nhưng có thể tưởng tượng được một kịch bản liên quan đến dữ liệu của bạn. Một lỗi khó hiểu đã xuất hiện vào một ngày gây ra sự cố thất bại lần đầu tiên đánh sập một máy chủ duy nhất, sau đó khi tải thay đổi, nó đã gỡ bỏ phần còn lại của trang web đó và sau đó khi tải lại dịch chuyển, nó đã gỡ bỏ các trang web khác lưu trữ cơ sở hạ tầng đó. (Tôi tin rằng họ đã giải quyết vấn đề này kể từ đó). Dữ liệu không bị mất trong trường hợp này, nhưng có thể tưởng tượng được một kịch bản liên quan đến dữ liệu của bạn.

Bạn muốn bản sao lưu của mình miễn nhiễm với tất cả những thứ đó, và thậm chí có thể truy cập được trong khi cơ sở hạ tầng đó bị hỏng. Nếu dữ liệu không có sẵn trong một tuần trong khi RAID của bạn xây dựng lại, việc có thể khôi phục các tài liệu quan trọng trong kinh doanh từ bản sao lưu là tốt (mặc dù không bắt buộc). Nếu RAID của bạn biến mất, sau đó sao chép sang trang web khác của bạn, bạn sẽ thực sự muốn bản sao lưu đó đến từ một nhà cung cấp riêng biệt hoặc trên một số phương tiện bị cô lập như băng.

Tất cả những gì đã nói, tôi sẽ nhắc lại rằng bản sao lưu của bạn phải nằm trên một cơ sở hạ tầng riêng biệt với dữ liệu của bạn. Có nhiều mức độ cô lập ở đây, nhưng tôi nghĩ rằng bất cứ điều gì được kết nối thông qua sao chép trực tiếp là quá gần để trở thành một bản sao lưu. Bạn sẽ muốn một cái gì đó ngoài ra.


1

Giả định: hệ thống lưu trữ sẽ được sử dụng bởi nhiều ứng dụng.

Tôi nghĩ bạn sẽ làm tốt hơn nhiều với một hệ thống sao lưu riêng.

RAID và phản chiếu không phải là sao lưu nhưng tính năng rollback tích hợp có thể thay thế một hệ thống sao lưu truyền thống.

NHƯNG:

Tôi thích các chính sách khôi phục là dựa trên ứng dụng / dữ liệu và không dựa trên lưu trữ vì:

  1. các ứng dụng có các yêu cầu khác nhau liên quan đến phục hồi và mất dữ liệu chấp nhận được (một số trong số chúng được áp đặt bởi các quy định khác nhau: phương tiện chỉ đọc, mã hóa, giữ X năm cuối, v.v.),
  2. một số ứng dụng có (rất) các công cụ sao lưu và phục hồi tốt (oracle, mssql) và được khuyến nghị cách thực hiện phần sao lưu / phục hồi (như một DBA của Oracle, tôi thích và tôi sẽ thực hiện tất cả các bản sao lưu liên quan đến Oracle với rman).
  3. tăng trưởng, việc sử dụng không gian của bạn có thể tăng nhanh hơn nhiều so với mong đợi của bạn, hiện tại hệ thống này có thể chứa 30 ngày dữ liệu khôi phục, điều này không được đảm bảo trong tương lai
  4. rẻ hơn, chi phí sử dụng băng lớn hơn để điều chỉnh các chính sách sao lưu / phục hồi, sau vài năm tăng trưởng, sẽ nhỏ hơn chi phí mua đĩa mới, lớn hơn để tôn trọng cùng cửa sổ rollback như bây giờ
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.