Ảnh chụp nhanh + RAID được coi là một giải pháp sao lưu tại chỗ tốt?


19

Hai lý do chính mà tôi có thể nghĩ đến khi thực hiện sao lưu dường như được quan tâm khi tôi sử dụng cả snapshot và RAID cùng với btrfs. (Theo RAID ở đây, ý tôi là RAID1 hoặc 10)

  • Vô tình xóa dữ liệu: Ảnh chụp nhanh bao gồm trường hợp này
  • Lỗi ổ đĩa và mục nát bit
    • Hoàn toàn thất bại: RAID bao gồm trường hợp này
    • Ổ đĩa trả về dữ liệu xấu: Tính năng sửa lỗi của RAID + btrfs bao gồm trường hợp này

Vì vậy, là một giải pháp sao lưu tại chỗ, điều này dường như hoạt động tốt và thậm chí nó không cần một thiết bị lưu trữ dữ liệu riêng cho nó!

Tuy nhiên, tôi đã nghe nói rằng cả RAID và ảnh chụp nhanh đều không được coi là bản sao lưu phù hợp, vì vậy tôi tự hỏi liệu tôi có bỏ sót điều gì không.

Ngoài btrfs chưa phải là một công nghệ trưởng thành, bạn có thể nghĩ bất cứ điều gì tôi đã bỏ lỡ? Hoặc suy nghĩ của tôi là đúng và đây là một giải pháp sao lưu tại chỗ hợp lệ?


2
Chúng tôi làm điều tương tự như bạn: RAID 5 với Shadow Copy; tuy nhiên, chúng tôi cũng có hai ổ cứng USB ngoài trang web, sao lưu bằng Robocopy mỗi đêm (xoay ổ đĩa hai lần một tuần để một ổ luôn ở ngoài trang web). Điều này cũng cung cấp cho chúng tôi các bản sao lưu để khắc phục thảm họa, nhưng không phải là tài liệu lưu trữ dài hạn , điều mà tổ chức nhỏ của chúng tôi không thực sự cần. Bạn nên nâng cấp lên ít nhất là có một bản sao dữ liệu ngoài trang web trên máy chủ của mình vì nếu mảng RAID của bạn chết, bạn cũng sẽ mất ảnh chụp nhanh.
Austin '' Nguy hiểm '' Quyền hạn

Nếu bạn muốn tìm hiểu xem liệu toàn bộ mảng RAID có thể thất bại hay không, hãy đánh một cái bằng búa tạ và thử khôi phục dữ liệu của bạn. Có cả một lớp những thứ xấu có thể lấy ra toàn bộ một hộp mà không lấy ra toàn bộ trang web. Điều đó nói rằng, nếu các bản sao lưu tại chỗ của bạn chỉ là một sự tiện lợi có thể giúp bạn phục hồi chậm hơn từ các bản sao lưu ngoài trang web, thì về nguyên tắc, chúng có thể tệ như bạn muốn.
Steve Jessop

Có, chúng tôi đã có bản sao lưu ngoài trang web và một giải pháp tại chỗ "truyền thống" hơn. Lý do tôi hỏi câu hỏi này bởi vì tôi đã đọc xung quanh về các tính năng của btrfs và ZFS, và tự hỏi liệu nó có phù hợp để thay thế cho các bản sao lưu tại chỗ không.
小 太郎

Câu trả lời:


42

Không, không phải vậy.

Điều gì xảy ra khi hệ thống tập tin hoặc khối lượng RAID của bạn bị hỏng? Hoặc máy chủ của bạn bị đốt cháy? Hoặc ai đó vô tình định dạng sai mảng?

Bạn mất tất cả dữ liệu của mình các bản sao lưu không có thật mà bạn nghĩ bạn có. Đó là lý do tại sao các bản sao lưu thực sự nằm trên một hệ thống hoàn toàn khác với dữ liệu bạn đang sao lưu - bởi vì các bản sao lưu bảo vệ chống lại điều gì đó xảy ra với hệ thống được đề cập sẽ gây mất dữ liệu. Giữ các bản sao lưu của bạn trên cùng một hệ thống khi bạn sao lưu và mất dữ liệu trên hệ thống đó cũng có thể ảnh hưởng đến "bản sao lưu" của bạn.


Làm thế nào về giải pháp này, vì tôi chạy vào nó thường xuyên? Ảnh chụp nhanh cục bộ + ảnh chụp nhanh từ xa đến máy chủ khác (tại chỗ hoặc ngoài cơ sở) + RAID trên cả hai hệ thống có thể thay thế cho các bản sao lưu truyền thống không?
ewwhite

5
@ewwhite Giả sử họ đã kiểm tra khôi phục và một bản sao hoàn chỉnh của dữ liệu của bạn tồn tại trên một hệ thống từ xa, chắc chắn. Về cơ bản, đó là bản sao lưu từ đĩa sang đĩa ... và tôi rất thích sao lưu từ đĩa sang đĩa.
HoplessN00b

11

Để sao lưu tại chỗ , ảnh chụp nhanh thể đủ tốt, miễn là bạn thường xuyên 'xuất' ảnh chụp nhanh của mình ở một nơi khác, nơi nó tồn tại dưới dạng dữ liệu thụ động.

Và, thường xuyên kiểm tra xem 'ảnh chụp được vận chuyển' của bạn có thể được khôi phục hay không.

Đây là cách tôi triển khai sao lưu nhanh một số máy chủ của mình: lưu trữ dữ liệu trên ZFS, chụp ảnh nhanh ZFS, gửi delta đến máy chủ khác, trong đó toàn bộ hệ thống tệp được tạo lại (trừ dịch vụ thực tế đang chạy).

Tất nhiên, sao lưu tốt nhất luôn luôn là ngoài trang web. Do đó, sau khi 'vận chuyển' các ảnh chụp nhanh đến một hệ thống riêng biệt, hãy thường xuyên thực hiện 'băng ra' các ảnh chụp nhanh.

Vì vậy, trong hệ thống của tôi, máy chủ nhận được các ảnh chụp nhanh, thường xuyên chuyển tất cả các nhóm ZFS của nó (bao gồm các ảnh chụp nhanh trước đó) sang băng.

Và tất nhiên, kiểm tra băng từ của bạn để đảm bảo nó có thể được phục hồi.

Lưu ý: Bạn sẽ muốn ảnh chụp nhanh diễn ra trong khi hoạt động đĩa được kiểm tra và tốt nhất là phối hợp với cơ sở dữ liệu (nếu có) để đảm bảo tính nhất quán; Mặt khác, việc chữa trị có thể tồi tệ hơn bệnh tật. Đó là lý do tại sao tính năng 'chụp nhanh trực tiếp' của NetApp & EMC rất hữu ích: Họ sẽ hoãn ảnh chụp nhanh của LUN cho đến khi cơ sở dữ liệu sử dụng LUN chỉ ra rằng an toàn để thực hiện ảnh chụp nhanh.


Bạn có thể giải thích về cách bạn kết xuất các ảnh chụp nhanh ZFS của mình vào băng không?
ewwhite

@ewwhite bạn luôn có thể sao lưu .zfs/snapshotsthư mục hoặc gắn một trong các ảnh chụp nhanh ở một nơi khác để thực hiện thoát băng. Vì vậy, nó là một bản sao lưu riêng cho các ảnh chụp nhanh khác nhau.
pepoluan

Tôi đang làm điều này với zvols, thực sự ... vì vậy tôi không có thư mục .zfs để cdvào.
ewwhite

@ewwhite Ahh, tôi thấy ... trong trường hợp đó, bạn thể sử dụng zfs send $SNAPSHOT_NAME > $YOUR_TAPE_DEVICE, và sau đó làm a zfs receive $RESTORE_NAME < $YOUR_TAPE_DEVICE. Tuy nhiên, thật lòng tôi không có kinh nghiệm trong việc sao lưu zvols, mặc dù ...
pepoluan

8

Những gì HoplessN00b nói. Không.

Sao lưu đúng cách trên một thiết bị riêng biệt so với thiết bị được sao lưu. Điều gì xảy ra khi bạn mất hai hoặc nhiều ổ đĩa? Điều gì xảy ra khi phòng máy chủ của bạn bị cháy? Điều gì xảy ra khi ai đó vô tình phá hủy mảng của bạn?

(Cảnh báo giai thoại: Tôi đã từng nghe nói về một người nào đó đã cài đặt PXE để tự động cài đặt Fedora mới nhất. UPS của anh ta bị hỏng. Sau khi mất điện, máy chủ của anh ta đã khởi động lại và được cài đặt để khởi động PXE và ... cài đặt Fedora qua dữ liệu của anh ta. điểm? Những điều kỳ lạ xảy ra. May mắn thay, anh ta đã có bản sao lưu thích hợp.)

Tốt hơn là, bạn có ít nhất ba bản sao dữ liệu của mình, một bản được lưu trữ hoàn toàn bên ngoài trong trường hợp trung tâm dữ liệu bị cháy.


6

Ảnh chụp nhanh được triển khai đúng cách PHẢI được hỗ trợ bởi bộ lưu trữ của bạn vì các bản sao lưu đàng hoàng sử dụng chúng như là giai đoạn đầu tiên của việc tạo một công việc sao lưu. Tuy nhiên, đó là một ý tưởng tồi để sử dụng ảnh chụp nhanh để sao lưu chính. Lý do:

1) Ảnh chụp nhanh và lưu trữ phụ trợ CÓ THỂ thất bại. Vì vậy, các bản sao lưu thực phải được sử dụng bộ trục chính riêng biệt hoặc có cơ hội lớn để mất cả bộ làm việc chính và dữ liệu sao lưu cùng một lúc.

2) Ảnh chụp nhanh "nhai" không gian có thể sử dụng. Thật hợp lý khi sử dụng bộ lưu trữ nhanh và đắt tiền cho dữ liệu nóng hiện tại và ảnh chụp nhanh và tải dự phòng là dữ liệu lạnh cho một số bộ lưu trữ rẻ hơn và chậm hơn. Nó hoạt động rất tốt với 1) BTW.

3) Ảnh chụp nhanh thường làm chậm toàn bộ quá trình. Hầu hết các hệ thống sử dụng Copy-on-Write và cách tiếp cận này tạo ra sự phân mảnh. Chuyển hướng trên ghi nhanh hơn nhưng ăn rất nhiều không gian. Rất ít nhà cung cấp đã thực hiện đúng snapshot. NetApp với WAFL và Nimble Storage với CASL (Tôi không liên kết với bất kỳ ai trong số họ). Khá nhiều người khác có vấn đề. Ví dụ, Dell Equallogic kích hoạt cập nhật trang 15 MB (và lãng phí) trên mỗi byte đơn thay đổi. Đó là MỞ RỘNG.


6

Vâng, nó là. Đó là một cách hoàn hảo để lưu trữ các bản sao lưu. Không có gì khác là cần thiết, quái gì, thậm chí làm kiểm tra khéo léo chỉ là lãng phí thời gian.

Chỉ cần xác nhận - trước khi tôi cho thêm lời khuyên ... bạn làm việc cho một đối thủ cạnh tranh của tôi, phải không? Bạn thực sự làm, chắc chắn? Không? Oh.

Xin lỗi, NUTS. Không hoàn toàn không. Xin lỗi, anh bạn.

Vấn đề là bạn hoàn toàn cởi mở với bất kỳ lỗi nào xảy ra trong (a) hệ thống và (b) cấp độ hệ điều hành. Bạn về cơ bản chỉ bảo vệ chống lại ai đó xóa một số dữ liệu. Tốt đẹp. Đó là một lỗi thường xuyên xảy ra.

Những gì bạn không bảo vệ là:

  • Một sức mạnh tăng vọt quét sạch máy. Đã ở đó, thấy rằng.
  • Một số bộ điều khiển đột kích bị lỗi hoặc bộ nhớ ghi sh ** trên đĩa - không có gì cả.

Và một danh sách dài những thứ khác.

Đây là - một cách tự nhiên, trừ khi bạn làm việc cho đối thủ cạnh tranh của tôi - bạn luôn vui lòng tạo bản sao lưu:

  • Trên một máy tính khác
  • Rằng bạn cách ly với ít nhất là các xung điện (ngay cả khi bạn có USV).

Đây là lý do tại sao băng rock - chúng không được kết nối và bất cứ điều gì ngắn lửa hoặc lũ lụt sẽ không làm tổn thương chúng. Tăng đột biến - có đầu đọc băng và có thể là robot nhưng băng không nằm trong đầu đọc sẽ không bị ảnh hưởng.

TỐT NHẤT sẽ là các bản sao lưu ngoại vi (tôi đã đề cập đến những thứ như lửa và lũ lụt chưa?) (Một lần nữa, khi bạn làm việc cho một đối thủ cạnh tranh - không có thứ gì như một đám cháy tòa nhà, nó hoàn toàn không cần thiết, như bảo hiểm hỏa hoạn, xin vui lòng, tiết kiệm số tiền đó).

Bây giờ, bạn có thể nghĩ "oh, lũ lụt không bao giờ xảy ra". Hãy chắc chắn rằng bạn chắc chắn. Xem, đây là một video về một trận lụt 09/09/09 của trung tâm dữ liệu vodaphone. Tôi chắc chắn bạn sẽ hiểu vấn đề ở đâu là sao lưu / sao lưu máy tính:

http://www.youtube.com/watch?v=ttcQy3bCiiU



4

Bài học rút ra từ hai ổ RAID-1 không thành công trong vòng nửa giờ với nhau: RAID không phải là một cơ chế sao lưu, không theo bất kỳ cách thức, hình dạng hay hình thức nào.

RAID là một cơ chế sẵn có giúp giảm thời gian chết trong trường hợp lỗi phần cứng nhưng nó sẽ không giúp bạn chút nào trong trường hợp như Vi-rút, xóa / sửa đổi dữ liệu hoặc lỗi phần cứng thảm khốc.


1
Trong trường hợp của một số lớp lỗi phần cứng. Nếu thẻ RAID bị lỗi, container của bạn sẽ biến mất.
mfinni

3

Nhiều quản trị viên có kinh nghiệm đi theo quy tắc sao lưu 3-2-1:

  • Bạn nên có ít nhất ba bản sao dữ liệu của mình, bao gồm cả nguồn chính. Tức là một bản sao lưu là không đủ và các bản sao trong cùng một hệ thống vật lý không được tính.

  • Bạn nên sử dụng ít nhất hai phương pháp sao lưu khác nhau.

  • Bạn nên có ít nhất một bản sao dữ liệu ngoài trang web của mình.

Ảnh chụp vi phạm cả ba phần:

  • Bạn chỉ sử dụng một máy vật lý duy nhất. Bất cứ điều gì ảnh hưởng đến toàn bộ máy, chẳng hạn như lỗi PSU, có thể mang theo tất cả dữ liệu của bạn.

  • Bạn chỉ đang sử dụng một phương pháp duy nhất cho các bản sao lưu của mình. Nếu có bất cứ điều gì sai với nó, bạn sẽ chỉ tìm ra khi khôi phục lại bản sao lưu trong tình huống khủng hoảng.

  • Bạn không có bản sao lưu ngoài trang web. Lũ lụt và hỏa hoạn chỉ xảy ra với người khác, cho đến khi chúng xảy ra với bạn ...

Vì thế:

  • Bạn cần có ít nhất một bản sao lưu trên một máy riêng trên mạng LAN của mình.

  • Bạn cần phải có ít nhất một bản sao lưu không được tạo bằng các ảnh chụp nhanh. Có lẽ một tarkho lưu trữ gia tăng cũ có thể theo thứ tự? Hoặc một rsyncbản sao dựa trên?

  • Bạn cần phải có ít nhất một bản sao lưu từ xa, càng xa càng tốt từ vị trí hiện tại của bạn và chắc chắn không ở trong cùng tòa nhà.

Cũng cần chỉ ra rằng các ảnh chụp nhanh ở cấp độ khối có cùng một đảm bảo tính nhất quán như rút phích cắm trên máy của bạn và sau đó sao chép qua các đĩa. Nói chung, bạn sẽ cần phải chạy fscksau khi khôi phục hoặc hy vọng rằng tạp chí là đủ.

Ảnh chụp nhanh ở cấp hệ thống sẽ tốt hơn, nhưng chúng vẫn không đảm bảo tính nhất quán của các tệp của bạn. Đối với nhiều ứng dụng (máy chủ cơ sở dữ liệu xuất hiện), việc sao chép các tệp của một cá thể sống có thể hoàn toàn vô dụng, vì chúng có thể ở trạng thái không nhất quán. Bạn sẽ cần sử dụng cơ chế sao lưu cấp ứng dụng của riêng họ để đảm bảo sự tồn tại của một bản sao sạch - theo đó quy tắc 3-2-1 cũng sẽ được áp dụng.

Cuối cùng, hãy nhớ rằng ngay bây giờ chúng tôi chỉ nói về bản sao dữ liệu hiện tại của bạn . Để bảo vệ chống lại sự thất bại (hoặc vi phạm an ninh, vì vấn đề đó) vẫn không bị phát hiện trong một thời gian, bạn cũng cần phải có một vài bản sao dữ liệu trước đây trong một thời gian khá lâu.


Giả sử ảnh chụp nhanh btrfs là bất cứ thứ gì như ảnh chụp nhanh ZFS về mặt bảo đảm tính nhất quán (và với bao nhiêu cảm hứng mà btrfs rút ra từ ZFS, tôi không hiểu tại sao điều đó không xảy ra), ảnh chụp nhanh sẽ đại diện cho khoảnh khắc trên đĩa dữ liệu thời gian. Vì vậy, các hệ thống tập tin sẽ được ở một trạng thái nhất quán nếu bạn quay trở lại với một bản chụp, nhưng nếu dữ liệu được lưu giữ trong bộ nhớ RAM và chỉ đỏ mặt định kỳ và dữ liệu cần thiết để làm cho tinh thần của những gì trên đĩa (cf phần mềm máy chủ cơ sở dữ liệu) sau đó những người đặc biệt các tệp rất có thể sẽ ở trạng thái không nhất quán sau (hoặc trước đó!) rollback.
một CVn

2

Tự nó không phải là một giải pháp sao lưu . Nó sẽ làm giảm hoặc loại bỏ thời gian chết trong các tình huống nhất định thất bại nhưng không bảo vệ bạn ở tất cả các từ nhiều người khác

Tất nhiên nó có thể là một phần rất có giá trị của một giải pháp dự phòng + dự phòng tròn hơn:

  • RAID cộng với snapshows trên cùng một phần cứng
  • Các bản sao tại chỗ trên phần cứng khác (hãy nhớ: có các chế độ thất bại sẽ loại bỏ toàn bộ hộp, bộ điều khiển, ổ đĩa và tất cả trong một lần)
  • Bản sao từ xa bị ngắt kết nối
  • và tất nhiên các bản sao ngoại tuyến + ngoại vi thích hợp cho các thảm họa thực sự

Ngoài ra: hãy chắc chắn rằng bạn thường xuyên kiểm tra bản sao lưu của bạn. Thời điểm tồi tệ nhất để khám phá các bản sao lưu của bạn không hoạt động là khi bạn cần lấy một cái gì đó từ chúng ...

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.