Bạn cần bao nhiêu lượt để xóa / xé các tập tin của bạn để làm cho chúng không thể xóa được?


20

Nếu bạn có dữ liệu riêng tư trên một ổ cứng thông thường gần đây - bạn cần xóa bao nhiêu lần để xóa dữ liệu để không thể khôi phục?

Không có nghĩa, một nhóm pháp y gồm 20 chuyên gia với ngân sách 100 triệu euro hoặc đô la và 10 năm để khôi phục một vài byte từ một địa chỉ đã biết với độ chính xác 80%, nhưng rất ít người có vài 1000 € / $ ngân sách, những người sẽ không dành hơn hai tuần cho công việc và những người không biết nơi họ đang tìm kiếm.

Linux / GNU shrednói trong hướng dẫn:

   -n, --iterations=N
          overwrite N times instead of the default (3)

nhưng một mặt tôi đã nghe về một đề nghị của NSA để ghi đè lên 27 lần và mặt khác, các công ty phục hồi dữ liệu chuyên nghiệp không thể khôi phục dữ liệu từ một ổ đĩa bị xóa chỉ một lần.

Chứng cứ, giấy tờ, chứng cứ?

Lưu ý: Câu hỏi này không phải là:

  • Đây không phải là về các lĩnh vực xấu, nơi dữ liệu có thể lướt qua
  • Đây không phải là về các ổ đĩa MFM / RLL cũ từ đầu những năm 90
  • Nó không phải là về các công cụ khác nhau
  • Đó không phải là quá nhiều về phương thức (số ngẫu nhiên 0s, 0xFF và các mẫu ưa thích).
  • Đây không phải là về các kỹ thuật khác nhau để quét sạch nó một cách an toàn (năng lượng từ tính, tan chảy, lấp đầy cát và biến).
  • Đây không phải là vấn đề đặc biệt của ổ đĩa flash

5
Không ai từng chứng minh có thể khôi phục bất kỳ dữ liệu hữu ích nào sau 1 lần ghi đè lên ổ cứng hiện đại .... nber.org/sys-admin/overwritten-data-gutmann.html
Moab

Câu trả lời:


48

Một lần.

Phương tiện từ tính hiện đại khá hiệu quả và để lại rất ít bằng chứng về các vị trí bit trước đây. Những gì bị bỏ lại phía sau đòi hỏi kính hiển vi điện tử và / hoặc máy đo từ tính công nghệ cao (hoặc bất cứ thứ gì chúng được gọi). Tất cả các thiết bị như vậy đều đắt tiền khủng khiếp, và ngay cả với các thiết bị tốt nhất và các chuyên gia lành nghề nhất, phải mất một khoảng thời gian khổng lồ (nghĩ nhiều năm cho một đĩa đơn; tất cả các đĩa cứng đều có nhiều đĩa) và có tỷ lệ thất bại rất cao.

Nếu bạn đang giải quyết các bí mật của chính phủ (như NSA) thì hãy viết - một lần có lẽ không đủ, bởi vì Trung Quốc không có vấn đề gì trong việc sử dụng và sử dụng các thiết bị này, cũng như không sử dụng đội ngũ hàng trăm chuyên gia chuyên môn để sử dụng chúng.

Mặt khác, nếu bạn chỉ đơn thuần là xử lý mật khẩu ngân hàng cá nhân và bí mật pr0n bí mật của bạn, một lần duy nhất là đủ để kết xuất dữ liệu hoàn toàn không thể phục hồi từ bất kỳ phương tiện thực tế nào .

Điều đó nói rằng, các đĩa hiện đại khá nhanh và trừ khi bạn xóa toàn bộ ổ cứng, nhiều lần mất rất ít thời gian mà thực sự không có lý do gì để không thực hiện chúng. Do đó, trong khi sai lầm mà bạn phải ghi đè nhiều lần với các mẫu đường chuyền phức tạp đủ rộng để tất cả phần mềm "xóa an toàn" mặc định thành nhiều đường chuyền, thì thực sự rất ít điểm để ghi đè các mặc định đó. Khi tôi sử dụng shred(số lần chuyền mặc định: 3) Tôi để nó thực hiện 3 lượt đi; Khi tôi sử dụng Eraser trên Windows (số lần truyền mặc định trên một tệp: 35), tôi để nó thực hiện 35 lượt. (Công cụ xóa mặc định chỉ một lần duy nhất khi xóa dung lượng trống trên ổ cứng; điều này cũng vậy, tôi cũng chạy theo mặc định.)

Vì vậy, câu trả lời cho câu hỏi của bạn (Cần bao nhiêu lượt?) Là: "Một". Câu trả lời cho câu hỏi ngụ ý của bạn (Tôi có nên ghi đè 3 lượt mặc định của shred không?) Là: "Nah."

Mặt khác, nếu bạn là một đại lý chính phủ bí mật, tốt, một vượt qua thực sự là không đủ bởi vì bạn làm có Trung Quốc sau khi dữ liệu của bạn. Tuy nhiên, nếu đây là trường hợp, bạn nên hỏi cấp trên / người xử lý xem các quy định của cơ quan bạn có liên quan đến việc xóa an toàn dữ liệu nhạy cảm, không phải SU. ;-)

Hãy cẩn thận: Phương tiện dựa trên flash sử dụng một hệ thống gọi là "cân bằng hao mòn" để kéo dài tuổi thọ của thiết bị. Không đi sâu vào chi tiết về thuật ngữ này có nghĩa là gì hoặc lý do đằng sau nó, điều đó có nghĩa là bạn thực sự không thể xóa các tệp trên phương tiện dựa trên flash trừ khi bạn xóa sạch toàn bộ phương tiện và thậm chí không thể luôn đảm bảo rằng Các thuật toán cân bằng hao mòn không để lại dữ liệu chưa bị xóa mà bạn không thể ghi vào. Trong trường hợp phương tiện dựa trên flash, cách tốt nhất của bạn là chỉ cần mã hóa bất kỳ và tất cả dữ liệu nhạy cảm đi vào nó, sử dụng mật khẩu mạnh.

Tài liệu của TrueCrypt bao gồm một cuộc thảo luận tuyệt vời về vấn đề này và các cách để giải quyết nó.


Nhiều, rất nhiều điểm cộng cho một câu trả lời tuyệt vời. Quá tệ, tôi chỉ có một để cho. :(
CajunLuke

4
Điều đó hoàn toàn đóng đinh nó. Tôi cũng nói thêm, trình quét guttman 35 cũ đã giả định rằng bạn không biết loại ổ đĩa nào bạn đã sử dụng và các mẫu chạy như vậy dành riêng cho MFM và các thiết kế lỗi thời khác
Journeyman Geek

Một lưu ý liên quan đến các đĩa là về mặt lý thuyết, một số dữ liệu có thể được phục hồi bằng cách bù đầu để lấy dữ liệu được ghi khi ổ đĩa ấm hơn hoặc mát hơn và do đó đầu được định vị hơi khác. Nhưng tôi chưa bao giờ nghe nói về kỹ thuật này thực sự được sử dụng (ít nhất là bên ngoài NSA).
Daniel R Hicks

1
@Kromey - Các ổ đĩa hiện đại sử dụng phản hồi servo để định vị đầu là công nghệ bù nhiệt độ. Ổ đĩa cũ tại một thời điểm sử dụng động cơ bước. Với một trong những điều này, bạn có thể để máy tính không được cấp điện qua đêm trong nhà để xe không sử dụng và hoàn toàn không thể tìm thấy dấu vết 0. Khởi động máy tính và để nó chạy nửa giờ, đặt lại và nó sẽ khởi động vì đĩa đã phát triển đủ để đặt theo dõi trở lại dưới đầu đọc / ghi. Đó là lý do tại sao chúng tôi rời máy chủ qua đêm trong cửa hàng của chúng tôi.
Phòng thí nghiệm Fiasco

1
Tôi thích cách anh chàng này trình bày kịch bản "Nếu bạn là điệp viên bí mật".
Bangal Dushyant

16

Đây là một câu hỏi cũ nhưng tôi cảm thấy buộc phải ném vào hai xu của mình khi tôi có kinh nghiệm phục hồi dữ liệu pháp y.

Câu hỏi đang được hỏi hoàn toàn là học thuật, vì vậy câu trả lời này cũng hoàn toàn mang tính học thuật. Thực tế mà nói, câu trả lời được chấp nhận là chính xác; một lượt là đủ để làm cho dữ liệu trên một ổ đĩa không thể phục hồi. Tuy nhiên, có một lý do mà các chính phủ bắt buộc phải thông qua nhiều lần.

Mọi người nghĩ về một ổ cứng như một thiết bị kỹ thuật số; các bit từ tính được sắp xếp theo một mô hình chặt chẽ và được "bật" lên hoặc tắt bởi các đầu ổ đĩa. Nhưng trong thực tế, một ổ cứng là một thiết bị tương tự như liên quan đến vật lý của phương tiện truyền thông từ tính. Bề mặt của các đĩa được phủ một đế chứa đầy các lưỡng cực từ nhỏ hơn 'bit' kỹ thuật số mà chúng đang mã hóa. Số lượng đủ của các lưỡng cực này theo một hướng so với hướng khác tạo thành điện trở thuần ở cấp độ bit riêng lẻ. Đó là ngưỡng kháng cự xác định xem một bit được hiểu là phân cực 1 hay 0, không phải là phân cực 'bật' hoặc 'tắt'.

Đối với các thiết bị điện tử của ổ đĩa, tín hiệu điện phát ra từ đầu là sóng hình sin được điều chế, không phải là luồng bit 1 và 0. Đây chính xác là cách các băng từ ghi lại tín hiệu âm thanh từ nhiều thập kỷ trước - chỉ bây giờ chất nền dày đặc hơn nhiều và chúng tôi đang sử dụng toán học để trích xuất tín hiệu kỹ thuật số ra khỏi "nhiễu" tương tự.

Bây giờ, về mặt vật lý, không thể tạo ra một đĩa hoàn hảo 100% và ngay cả khi bạn có thể môi trường hoạt động cũng không bao giờ hoàn hảo 100%. Ở quy mô vật lý mà các ổ đĩa cứng hiện đại hoạt động, có hàng trăm yếu tố âm mưu tạo ra sự không hoàn hảo của tín hiệu và chúng gây ra một vấn đề đủ quan trọng đến 1-2% không gian trên một ổ đĩa thông thường "Lãng phí" về sửa lỗi để đối phó với chúng. Ổ cứng của bạn thực sự đang phục hồi từ các lỗi mọi lúc . Hoạt động của ổ cứng thông thường thực sự là một trò chơi xác suất trong đó khu vực "tốt" chỉ là xác suất n% mà dữ liệu được mã hóa ở đó là chính xác.


Bây giờ hãy xem xét trường hợp của các thành phần xấu và bạn có thể thấy cách áp dụng kỹ thuật tương tự cho các lĩnh vực tốt.

Nếu một khu vực được đánh dấu là "xấu" (bởi bộ điều khiển, không phải bởi HĐH), điều đó có nghĩa là xác suất TẤT CẢ các bit dữ liệu trong một khu vực cụ thể, khi được đưa ra dưới mức tổng thể, đã giảm xuống dưới ngưỡng khả năng phục hồi toán học bởi các thuật toán sửa lỗi của ổ đĩa. Điều đó không có nghĩa là các bit thực sự đã chết; chỉ có điều khiển không thể chắc chắn rằng chúng đúng.

Tuy nhiên, bạn có thể khôi phục một khu vực xấu bằng cách đọc nó hàng trăm, hoặc có thể hàng ngàn lần tùy thuộc vào mức độ thiệt hại. Với mỗi lần vượt qua người đứng đầu khu vực "xấu", lĩnh vực này đọc theo một cách hơi khác nhau. Các đĩa lắc lư, nhiệt độ, rung, đồng hồ, vv tất cả có thể hơi khác nhau. Nhưng nếu bạn so sánh mỗi lần vượt qua với hàng ngàn lần vượt qua trước khi đủ số lần, bạn có thể khôi phục (với độ chính xác thấp hơn một chút) dữ liệu mà khu vực xấu chứa trong đó trước khi nó trở nên tồi tệ với bạn. Đây chính xác là cách phần mềm khôi phục dữ liệu như SpinRite hoạt động.

Bây giờ hãy áp dụng logic đó cho một lĩnh vực "tốt". Khi bạn xóa sạch ổ đĩa bằng một lần chạy, bộ điều khiển chắc chắn 100% rằng mỗi cung chứa bất kỳ mẫu bit nào bạn điền vào ổ đĩa. Nhưng vẫn còn lỗi trong các lần đọc đó và bộ điều khiển vẫn đang sửa chúng. Một số trong những lỗi đó là do môi trường, nhưng rất có thể nhiều trong số chúng cũng là tàn dư của bất kỳ dữ liệu nào có trước khi khu vực này bị ghi đè.

Hãy nhớ rằng chúng ta đang nói về cùng một công nghệ mà chúng ta đã sử dụng trên các băng âm thanh trong nhiều thập kỷ ở đây. Không phải tất cả các lưỡng cực từ đó bị lật trong đường chuyền đơn đó, do đó vẫn có tín hiệu "ma" trong tiếng ồn.

Để trích dẫn Adam Savage (của Thần thoại): "Tôi từ chối thực tế của bạn và thay thế chính tôi." Nếu bạn mất điều khiển của ổ đĩa (với nó là sự chắc chắn toán học của mô hình dữ liệu bị xóa sổ) ra khỏi phương trình và chỉ cần nhìn vào làn sóng sin sắp tắt thiết bị điện tử của ổ đĩa, nó có thể là có thể về mặt lý thuyết để tái tạo lại dữ liệu đã có mặt trên ổ đĩa trước khi nó bị xóa - giống như chúng ta thường làm với các băng âm thanh đã bị "xóa".

Hoặc có thể không. Nó không giúp được gì với 18 phút mất tích của băng Nixon Watergate ... Hay là vậy? ;-)


Bây giờ, điều này có thực tế không? Liệu một thiết bị như vậy có khả năng làm điều này thực sự tồn tại? Có lẽ. Có thể không. Nếu nó đã làm, nó chắc chắn sẽ là một bí mật nhà nước. Nhưng vì về mặt lý thuyết là có thể, bạn phải bảo vệ về mặt lý thuyết chống lại nó. Điều đó có nghĩa là thực hiện nhiều đường chuyền với nhiều mẫu bit để tranh giành tín hiệu ma đó càng nhiều càng tốt.

Nếu bạn là một chính phủ đang cố gắng xóa sạch dữ liệu được phân loại, điều quan trọng là phải xem xét. Nếu đó là bí mật pr0n bí mật của bạn thì có lẽ là không (trừ khi vợ bạn làm việc cho NSA).


3
Quá nhiều suy nghĩ và nỗ lực để không nâng cao điều này.
Damon

Btw nếu tôi có bí mật nhà nước trên ổ cứng, tôi sẽ không tin bất kỳ số lượng ghi đè nào trên đó. Tôi sẽ tài nguyên cho một máy mài góc hoặc ống thổi.
Marc.2377
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.