Lưu trữ lâu dài dữ liệu quan trọng trong kinh doanh


16

Đây thực sự là một vấn đề khó khăn và ở một mức độ nào đó nó không phải là vấn đề kỹ thuật và có thể không thuộc về nơi này, nhưng

Server Fault dành cho quản trị viên hệ thống ... những người quản lý hoặc bảo trì máy tính ở khả năng chuyên nghiệp

Và tôi làm .. và đây là một trong những nhiệm vụ của tôi .. Dù sao đi nữa.

Hãy tưởng tượng bạn có 5000 + trang hai mặt của A4. Dữ liệu công ty, tất cả kinh doanh quan trọng.
Bạn cần phải sao lưu nó, bằng cách nào đó. Các giải pháp đề xuất cho đến nay là:

  1. PDF -> Lưu trữ trực tuyến
  2. PDF -> DVD / BluRay / Băng
  3. PDF -> Ổ cứng di động / SSD / Flash.
  4. Mua / Thuê / Thuê / 'Ăn cắp' một máy photocopy lớn và tạo bản sao.
  5. ???

Vấn đề trước mắt với những điều trên:

  1. Điều gì xảy ra nếu đối tác lưu trữ bị phá sản?
  2. DVD làm thối theo thời gian. Băng tương tự.
  3. Những điều này cũng vậy, phá vỡ theo thời gian.
  4. Đắt. Chậm. Nặng. Không thân thiện với cây.

Câu hỏi:

Tiêu chuẩn vàng để lưu trữ và lưu trữ dữ liệu dài hạn đến trung hạn là gì? Bạn đã giải quyết một vấn đề tương tự ở nơi làm việc?

Sau khi tải ban đầu, có một số yêu cầu để thêm vào bộ sưu tập khoảng 100 trang mỗi tháng. Truy xuất nên có thể, dễ dàng, nhưng có lẽ là không thường xuyên.
Lý tưởng nhất là tôi muốn đảm bảo rằng giải pháp sẽ hoạt động được lâu sau khi tôi rời công ty và nó sẽ không cần một số lượng lớn để duy trì nó, vì vậy lưu trữ nhiều đĩa DVD không chỉ không lý tưởng, mà còn không một giải pháp lâu dài tốt.

Mặc dù chỉ tạo ra các bản sao giấy chắc chắn là dễ nhất, nhưng nó không thân thiện với môi trường nhất, không phải là một chặng đường dài. Nó cũng không dễ quản lý, khó tìm kiếm, lập chỉ mục, v.v. Kết hợp với nặng, và khó lưu trữ vật lý.

Tôi khá thích ý tưởng về nguyên tắc có mọi thứ được lưu trữ điện tử, nhưng cơ chế thực tế của việc này cần phải minh bạch và dễ dàng. Tôi thực sự không muốn chịu trách nhiệm cho việc này mãi mãi và một ngày, hỗ trợ người dùng văn phòng khi họ làm hỏng nó và mất tài liệu. Tôi cũng không muốn phụ thuộc vào một nhà cung cấp lưu trữ duy nhất, nếu Dropbox (Chúng tôi có ATM giải pháp sao lưu trực tuyến, nhưng đó không phải là Dropbox.) Đã bị phá sản, hoặc nếu không thì sẽ gặp phải một sự kiện thảm khốc, có bao nhiêu doanh nghiệp Ai đang sử dụng dịch vụ của họ sẽ lên lạch, sans chèo?

Có một số linh hoạt ngân sách ở đây, nhưng tôi nghi ngờ bất cứ thứ gì có giá cao hơn bản sao lưu trực tuyến hiện tại của chúng tôi (giống như 2500USD / năm), sẽ được xem ít hơn so với việc đặt nó vào một hộp đựng giày dưới giường. Không còn nghi ngờ gì nữa, điều gì sẽ xảy ra nếu tôi không làm gì và từ chức vào ngày mai.

Có ý kiến ​​gì không?

-Biên tập-

Lý do để làm điều này là gấp đôi.

1) cung cấp một bản sao lưu an toàn hợp lý của các giấy tờ quan trọng trong kinh doanh trong trường hợp văn phòng bị cháy.

2) để đáp ứng luật lưu trữ dữ liệu Luật thuế WRT uk cho các doanh nghiệp, v.v.

Chỉnh sửa 2:

Có một số cơ chế để lập chỉ mục các tài liệu cũng rất hữu ích ..


Tôi đã gõ một kịch bản nhanh để thực hiện PDF-> Txt với ghostscript và goc. Ngẫu nhiên xem xét squirting mọi thứ vào một db SQLlite để tạo một số chỉ mục thú vị cho dữ liệu.
Tom O'Connor

Dự phòng (của phương tiện kỹ thuật số) và duy trì dự phòng trong suốt những năm qua có thể là người bạn tốt nhất của bạn.
Vortico

Câu trả lời:


5

Giữ dữ liệu ở định dạng như PDF có thể an toàn, vì có các công cụ miễn phí để đọc nó. Khối lượng dữ liệu bạn đang nói đến khá nhỏ (1.200 trang / năm), vì vậy ngay cả ở độ phân giải quét 300 dpi, bạn chỉ nói về hàng chục gigabyte mỗi năm.

Vấn đề thiết bị lưu trữ vật lý là không bao giờ biến mất, mặc dù. Bất cứ phương tiện nào bạn sử dụng để lưu trữ dữ liệu điện tử (băng, quang, v.v.) cuối cùng sẽ cần phải được cập nhật lên phương tiện mới hơn. Lập kế hoạch và ngân sách để "đưa dữ liệu xuống đường" sang các định dạng mới vì các định dạng mới thay thế các định dạng cũ hơn.

Có lẽ tôi xem phương tiện quang học là lựa chọn đầu tiên đơn giản chỉ vì bạn có quá ít dữ liệu. Tôi cũng có kế hoạch đốt 3 bản sao của mọi thứ và làm mới phương tiện truyền thông cứ sau 2 - 3 năm.

Nếu phương tiện quang học quá nhỏ, tôi sẽ sử dụng băng LTO và làm mới phương tiện truyền thông cứ sau 4 - 5 năm. Tuy nhiên, điều đó sẽ khá tốn kém cho một lượng dữ liệu nhỏ như vậy.


ĐĨA DVD? Hay Blu-ray? BR có phải là định dạng hợp lý cho dữ liệu chưa?
Tom O'Connor

1
@Tom O'Connor: Họ có vẻ giống tôi. Tôi sẽ xem xét chi phí để đưa ra quyết định. Hiện tại có các khoảng trống Blu-Ray "lưu trữ", vì vậy từ góc độ kỹ thuật, nó có vẻ như là một định dạng khả thi. (Các nhà sản xuất nói rằng Blu-Ray phương tiện truyền thông đã có một cuộc sống "đánh giá" 200 năm không cho tôi bất kỳ tự tin hơn so với những người nói rằng phương tiện truyền thông DVD lưu trữ đã có một năm 100 "đánh" suốt đời ...)
Evan Anderson

Tôi có một số đĩa CD-R Kodak từ khoảng năm 1998, hoặc hơn thế, và chúng vẫn có thể đọc được. Tôi cũng có một số cái miễn phí, trong đó lớp thuốc nhuộm đã tách ra và chúng bị vặn.
Tom O'Connor

Tôi không gợi ý rằng không có sự khác biệt trong lưu trữ so với phương tiện không lưu trữ. Tôi chỉ đơn giản nói rằng phương tiện lưu trữ cấp độ lưu trữ Blu-Ray so với phương tiện lưu trữ cấp lưu trữ DVD dường như không khác nhiều đối với tôi. So sánh cấp độ lưu trữ so với "trục chính 100 cho phương tiện truyền thông $ 20,00" là một câu chuyện hoàn toàn khác.
Evan Anderson

Một mục không được đề cập là bộ lưu trữ Trạng thái rắn (ổ USB): Lớn hơn quang, nhỏ hơn LTO. USB có khả năng tồn tại ít nhất một hoặc hai thập kỷ nữa và ổ ngón tay cái 16 GB hoặc 32 GB (hoặc hai hoặc ba) là khá rẻ về chi phí lưu trữ. Vì nó sẽ được ghi một lần-Đọc-Nhiều bạn không phải lo lắng về việc các tế bào SSD bị hao mòn, vì vậy về mặt lý thuyết bạn có thể giữ gậy trong 5 năm trở lên trong một hầm chống cháy.
voretaq7

6

Có những hệ thống cụ thể sử dụng nội bộ DVD và di chuyển dữ liệu sang phương tiện mới thường xuyên. Tra cứu bảo quản kỹ thuật số.

Vì các yêu cầu lưu trữ tăng khá nhanh, nên chuyển sang loại phương tiện mới hơn, lớn hơn cứ sau vài năm.

Giả sử bạn nhận được dữ liệu ở dạng giấy, bạn cần phải:

  1. Liệt kê dữ liệu khi nhập thư. Điều này có thể có nghĩa là cung cấp cho mỗi tờ một mã vạch duy nhất.
  2. Quét nó. Sử dụng mã định danh mã vạch làm tên tệp. Lưu trữ giấy.
  3. Lưu trữ dữ liệu. Đặt dữ liệu trên một hệ thống lưu trữ an toàn sửa đổi. Một máy chủ tệp sẽ không đủ tốt bởi vì điều gì đó có thể xảy ra với các tệp nếu chúng có thể ghi được.
  4. Làm cho nó có thể truy cập được cho các hệ thống khác.

Trong trường hợp khách hàng, đó là tất cả các hóa đơn cho một tổ chức lớn phải được chuyển sang hệ thống trực tuyến (SAP). Việc lưu trữ lưu trữ đã trải qua một số lần lặp lại. Hiện tại họ đang chuyển sang tia màu xanh.

Mặt khác, ngày nay mọi thứ đều đi vào đĩa, vì vậy có thể một cái gì đó dọc theo những dòng này sẽ là cách bạn đi: http://www.eurostor.com/german/iTernity.D.php


Hãy nhớ rằng hầu hết các DVD-R (et al) chỉ tồn tại một vài năm trước khi xuống cấp. Các công cụ "lưu trữ" đắt tiền sẽ tồn tại lâu hơn nếu được giữ theo hướng dẫn.
Chris S

Hầu hết các đĩa, máy chủ, hệ thống tệp hoặc định dạng tài liệu cũng vậy. Lưu trữ có nghĩa là di chuyển dữ liệu. Hãy thử đọc pdf trong 20 năm. Bạn có nhớ những gì các tiêu chuẩn là 10 năm trước? Chúng tôi không có gì đến gần giấy, thực sự. Ngoại trừ sao chép và dán ...
Posipiet

Tài liệu văn bản thuần túy vẫn còn đọc được.
Bart Silverstrim

Có các công cụ miễn phí để đọc PDF. Miễn là họ là "vani đơn giản", tôi sẽ không quá lo lắng. TIFF cũng là một lựa chọn tốt.
Evan Anderson

3

Giải pháp của chúng tôi: Quét vào PDF -> Sao lưu vào băng

Chúng tôi có một máy quét tài liệu, thực hiện ~ 30 trang / phút và tạo các tệp PDF OCRed. Chúng tôi sao lưu những băng lên tới Băng (cụ thể là LTO4) có thời hạn sử dụng từ 50 đến 100 năm (việc tìm ổ đĩa băng có thể khó khăn trong khung thời gian, nhưng có những nơi phục hồi dữ liệu vẫn sẽ phục hồi 8 "đĩa mềm xung quanh).


2
Tôi đã phải google 8 "đĩa mềm ....
Holocryptic

Tôi giữ lại các băng dự phòng của mình từ Mac OS 7.5. Nhưng đĩa bị hỏng, phương tiện sao lưu chương trình bị mất. Tôi đã quản lý để cài đặt lại Mac, nhưng tôi không thể đọc được băng vì tôi không có chương trình sao lưu. Và thẳng thắn, tôi thậm chí không nhớ tên của nó. Vâng, băng có thể kéo dài 100 năm. Nhưng người đọc không.
Posipiet

@Holocryptic: Chỉ một vài tháng trước, tôi đã phát ra một hộp chưa mở của đĩa mềm Verbatim 8 ".
user9517 được hỗ trợGoFundMonica

1
@Holocryptic: NSFW! NSFW !!
Bart Silverstrim

@Posipiet, tôi nghĩ rằng tôi đã đề cập đến thực tế rằng các ổ đĩa không tồn tại mãi mãi nhưng có những công ty chuyên phục hồi dữ liệu từ bất kỳ phương tiện truyền thông thường sử dụng nào.
Chris S

3

Tôi nghĩ rằng dịch vụ Glacier mới của Amazon là một dịch vụ thú vị trong không gian này.

Amazon Glacier được tối ưu hóa cho dữ liệu được truy cập không thường xuyên và thời gian truy xuất trong vài giờ là phù hợp. Với Amazon Glacier, khách hàng có thể lưu trữ một lượng dữ liệu lớn hoặc nhỏ với giá chỉ 0,01 đô la mỗi gigabyte mỗi tháng, một khoản tiết kiệm đáng kể so với các giải pháp tại chỗ.


2
Chi phí truy thu là vô cùng lớn.
Tom O'Connor

2

Bước một, Sao lưu: OCR các tài liệu, và sau đó sắp xếp lại tất cả các từ thành một loạt tiểu thuyết về Giáo hội Công giáo, Opus Dei và Templar. Bạn nên có đủ dữ liệu đầu vào cho khoảng 10 cuốn tiểu thuyết và khoảng một cuốn nữa mỗi năm hoặc lâu hơn. Duy trì bảng tra cứu chứa các từ vị trí ban đầu trong tài liệu nguồn (theo thứ tự nguồn) và đó là vị trí cuối cùng trong tiểu thuyết; lưu trữ các từ trùng lặp trong một mục trong bảng. Đảm bảo một thỏa thuận xuất bản và nhận được hàng triệu cuốn tiểu thuyết được xuất bản. Sử dụng doanh thu từ việc bán sách để tài trợ cho OCR và hoạt động sắp xếp lại từ. Cắt nhỏ các tài liệu gốc và bán chúng dưới dạng giường hamster. Thỉnh thoảng có thể cần phải đặt đơn đặt hàng cho cây thánh giá, vật chất hoặc vé máy bay đến các địa điểm kỳ lạ, nếu bạn thấy bạn đang thiếu từ vựng từ các tài liệu đầu vào của bạn.

Bước hai, Phục hồi / truy cập: Không cần lưu trữ các bản sao của dữ liệu - tất cả những gì bạn cần là bảng tra cứu của bạn và một cửa hàng sách cũ.

Vì bảng tra cứu là điểm thất bại duy nhất của bạn, bạn vẫn sẽ cần sao lưu này. Nhờ sơ đồ mã hóa huffman được sử dụng, nó sẽ khá nhỏ, so với các tài liệu đầu vào của bạn, do đó có thể có thể được sao chép vào DVD. Để sao lưu ngoại vi, hãy ngồi trước một bản ghi nhật ký và đọc bảng tra cứu, trong khi tự quay video. Đặt phần trình diễn video của bạn trên sự hợp nhất của nghệ thuật và công nghệ vào Phòng trưng bày Tate Modern, trên màn hình cố định.


1

Bit quá sớm để mua nhưng có vẻ như HDS đã đưa ra một cơ chế lưu trữ dữ liệu vĩnh viễn dựa trên thạch anh - hãy ĐỌC .


1
Tôi đã nghe yêu sách lâu dài rất nhiều lần rằng tôi sẽ không bao giờ tin vào điều đó và không ai trong chúng ta sẽ sống đủ lâu để được chứng minh điều đó. Dự đoán vĩnh viễn là hoàn toàn vô giá trị và luôn luôn được chứng minh là sai.
John Gardeniers

-2

Tôi phải đưa ra Humyo.com (được mua bởi Trend Micro - tên đệm là bảo mật)

Họ mã hóa tất cả dữ liệu người dùng và máy chủ của họ được đặt trong Ngân hàng Anh trong một kho tiền.

Khá an toàn :)


1
Tôi cá là họ không thực sự ở Ngân hàng Anh. Không có phòng trong đó, nó đầy những nhân viên ngân hàng.
Tom O'Connor

5
Trend Micro, có tên đệm là bloatware ...
Tom O'Connor

Tôi đồng ý với bạn trên Trend Micro nhưng họ chỉ sở hữu nó, bạn hoạt động với phần mềm của Humyo
benhowdle89
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.