Tại sao xóa tệp với các mẫu ngẫu nhiên thay vì tất cả 0 hoặc 1?


28

Các tệp máy tính không thực sự bị xóa khi chúng bị xóa trên Windows. Con trỏ địa chỉ được giải phóng đơn giản và không gian đó được giải phóng để ghi đè lên sau này.

Đối với thông tin nhạy cảm, bạn nên xóa nó bằng một bộ lọc để che khuất tập tin trước.

Nó chỉ ra rằng các bộ lọc này viết một chuỗi cụ thể 1 và 0 vào ổ cứng qua nhiều lần lặp.

Tại sao bạn không thể viết tất cả các số không hoặc tất cả các số vào tệp và sau đó xóa nó bình thường?

Làm thế nào một người nào đó có thể quản lý để khôi phục dữ liệu từ một lần quét thẳng như thế nhiều hơn hoặc ít hơn bằng cách sử dụng nhiều lần lặp và mẫu?


4
Câu hỏi tuyệt vời.
JNK

Câu trả lời:


15

Phiên bản ngắn: về mặt lý thuyết , mẫu gốc vẫn có thể được đọc bởi một số phần cứng và phần mềm tinh vi nhất định. Để đảm bảo an toàn cho dữ liệu "bị xóa" của bạn, dữ liệu đó phải được xóa sạch.

Câu trả lời dài: http://en.wikipedia.org/wiki/Data_remanence


Chỉnh sửa: Công bằng với những người đã bỏ phiếu, tôi để lại câu trả lời của mình như được viết ban đầu; tuy nhiên, hãy đọc các bình luận để tiết lộ đầy đủ.

Nhiều người, bao gồm cả tôi, cảm thấy rằng bất cứ điều gì nhiều hơn một lần vượt qua với dữ liệu giả danh âm thanh mã hóa là một sự lãng phí thời gian và chu kỳ CPU.


Vì vậy, đối với phương tiện truyền thông từ tính, có một bit kế thừa có khả năng có thể được đọc?
JNK

6
Không phải là một bit kế thừa, nhưng ở cấp độ tách biệt với hệ thống tập tin, các mức năng lượng từ tính khác nhau trước đó không được trung hòa hoàn toàn mà không có một số ghi đè với các mẫu khác nhau. Nó chắc chắn là một hoạt động pháp y, đô la cao. (Megacorp và / hoặc ngân sách loại ba chữ cái đại lý) ...
Adrien

2
Đây là một tin đồn lâu năm, nhưng tôi không tin có bất kỳ bằng chứng nào hỗ trợ cho ý tưởng rằng điều này là có thể. Tôi đã đọc một số hành trình của mọi người để thử và tìm ai đó có thể làm điều này và tất cả họ đều ra về tay không. Tất cả họ đã đi đến kết luận rằng đó là một huyền thoại. Điều đó đang được nói, thực sự không biết những gì đang diễn ra hoặc không có trong các bức tường của các cơ quan ba chữ cái.
Jarvin

3
@Dan: Đầu tiên, tôi chắc chắn về phía "Gutmann đã bị bẻ khóa" trong cuộc tranh luận. "Một số người không đồng ý với lý thuyết này", theo tôi, đã ẩn ý trong "lý thuyết" của tôi, và được đề cập rõ ràng trong bài viết được liên kết. Với tinh thần "không nhân đôi nỗ lực", tôi đã hy vọng sẽ khiến mọi người đọc những gì đã là một bài viết khá hay thay vì chỉ đơn giản là đọc lại nó ở đây. Có lẽ tôi nên thẳng thắn hơn, vì vậy hãy nói: Nhiều người, kể cả tôi, cảm thấy rằng bất cứ điều gì nhiều hơn một lần vượt qua với dữ liệu giả ngẫu nhiên âm thanh là một sự lãng phí thời gian và chu kỳ CPU. YMWV
Adrien

1
Trong thời đại cũ của mã hóa MFM, mật độ dữ liệu thấp và động cơ bước, các ổ đĩa có vấn đề trong đó khoảng cách giữa các rãnh có thể giữ được từ hóa dư do định vị đầu lỏng và thay đổi nhiệt độ. Bài viết của Gutmann đã được viết lại vào năm 1996. 35 lần vượt qua của anh ấy, nhiều mẫu ghi đè cố định là một nỗ lực để xóa sạch một ổ đĩa một cách chắc chắn mà không biết gì về nó. Trong những thập kỷ kể từ đó, ông tuyên bố rằng việc cọ rửa với dữ liệu ngẫu nhiên là đủ cho các ổ đĩa mật độ dữ liệu cao hiện đại.
Phòng thí nghiệm Fiasco

3

Tôi nghĩ rằng tôi nhớ đã đọc một cái gì đó về các đặc tính từ tính của các platt sao cho bất kỳ tập hợp ghi đè ngẫu nhiên nào đó của một khối sẽ không nhất thiết phải khử từ hoàn toàn hoặc trả lại một vùng của đĩa về trạng thái trung lập hoàn toàn, do đó một số thông tin về dữ liệu trước đó là bỏ lại phía sau Cứ cho là tôi không nghĩ nó nhiều, nhưng nghe có vẻ đủ để một phân tích pháp y xác định có thể lấy lại ít nhất bản chất của dữ liệu bị xóa.

Ý tưởng về các mẫu cụ thể của 1 và 0 là chúng hoạt động với mã hóa 8 / 10B của ổ cứng (hoặc bất cứ thứ gì) được sử dụng để đưa khối lưu trữ từ tính tổng thể về trạng thái trung tính.

Hãy xem Spinrite , rõ ràng nó có thể cho bạn thấy các "mức" từ tính khác nhau mà dữ liệu được lưu trữ để khôi phục và "làm mới" dữ liệu trên ổ đĩa, ít nhất đó là những gì nó tuyên bố.


3

Phần mềm thông thường chỉ có các phương thức khôi phục không thể khôi phục dữ liệu được ghi đè một lần bởi bất kỳ mẫu nào, phải mất một ngân sách lớn và các kỹ thuật tinh vi để khôi phục dữ liệu đã bị ghi đè chỉ một lần. Một ghi đè là đủ tốt trừ khi bạn có FBI NSA, NASA, muốn có dữ liệu của bạn. Nhưng nếu sự hoang tưởng của bạn ghi đè lên nó 35 lần, sau đó tháo rời ổ cứng và nghiền các mảnh đất thành bụi mịn, sau đó phân tán bụi đó trong đại dương mở trong hành trình 100 dặm, hy vọng bạn sẽ không bị mắc kẹt trên một hòn đảo trong quá trình ,; )

Tất nhiên, các hệ điều hành hiện đại có thể để lại các bản sao của các tệp "đã xóa" nằm rải rác trong các khu vực chưa được phân bổ, các thư mục tạm thời, các tệp hoán đổi, các khối xấu, v.v., nhưng Gutmann tin rằng một khu vực bị ghi đè có thể được phục hồi khi kiểm tra bằng kính hiển vi tinh vi và tuyên bố này đã được chấp nhận một cách thô bạo bởi nhiều nhà quan sát. Tuy nhiên, tôi không nghĩ những nhà quan sát này đã theo dõi các tài liệu tham khảo trong bài viết của Gutmann. Vì vậy, tôi có thể nói rằng Gutmann không trích dẫn bất cứ ai tuyên bố đang đọc dữ liệu dưới mức trong các lĩnh vực bị ghi đè, và ông cũng không trích dẫn bất kỳ bài viết nào cho thấy các chương trình xóa đĩa thông thường sẽ không hoàn toàn hiệu quả.

http://www.nber.org/sys-admin/overwritten-data-guttman.html

.


Tại sao phải chà đĩa khi chỉ cần làm nóng các đĩa trên điểm Curie sẽ xóa hoàn toàn chúng? Nghiền bụi nếu bạn phải, nhưng lửa than tốt là rẻ.
Phòng thí nghiệm Fiasco

0

Hãy tưởng tượng bạn đã viết chi tiết nhạy cảm của công ty trên một bảng trắng. Một khi bạn rời khỏi phòng, bạn chỉ cần lau các chi tiết từ bảng. Tôi vẫn có thể đọc hầu hết trong số đó bằng cách nhìn vào bảng trắng dưới một góc, hoặc bằng cách sử dụng các kỹ thuật tiên tiến để nâng các dấu vết dư lượng đánh dấu phút từ bảng. Mặt khác, nếu bạn viết ngẫu nhiên lên bảng sau khi xóa nó, tôi sẽ khó đọc được bất kỳ chi tiết nào của công ty.

Sự tương tự này để ghi đè lên một đĩa cứng có số 0 so với dữ liệu ngẫu nhiên là lý do tại sao nhiều người tin rằng tốt hơn là ghi đè lên đĩa cứng của bạn với 0 và 1 ngẫu nhiên, và hơn một lần khi bạn ở đó.

Chỉ cần ghi đè tất cả dữ liệu bằng số 0 chắc chắn sẽ ngăn 99,9% dân số đọc dữ liệu nhạy cảm của bạn. Ghi đè lên nó bằng một mẫu có thể dự đoán được (vì máy tính vốn dĩ không ngẫu nhiên) là 0 và 1 sẽ khiến việc đó khó hơn một chút. Sử dụng một mẫu mã hóa an toàn sẽ làm cho điều đó vẫn khó hơn. Và lặp lại quá trình này sẽ nâng cao hơn nữa.

Nhưng do lợi nhuận giảm dần, tôi tin rằng một lượt giả danh 0 và 1 là quá đủ. Và nếu không, tốt hơn hết bạn nên mang đĩa cứng của mình đến một công ty hủy dữ liệu an toàn thay vì tăng sự hao mòn ổ đĩa và lãng phí chu kỳ và thời gian của CPU. Đĩa cứng có giá rẻ.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.