Những gì tôi có xu hướng làm để đảm bảo rằng tôi không bị mất dữ liệu là tôi chọn và chọn những tập tin tôi muốn giữ và một khi tôi có ổ cứng ngoài lớn (tính bằng byte, không phải theo chiều ngang) (thường là 2TB và thường là USB3 những ngày này), tôi sử dụng phương pháp kéo và thả thông thường để di chuyển các tập tin vào ổ đĩa sao lưu.
Sau đó, sau này tôi có thể sao chép lại nội dung vào ổ cứng thứ ba.
Tất cả đều rất đặc biệt.
Tôi biết về tất cả các cách để làm điều đó "tốt hơn", nhưng tôi quan tâm hơn một chút về điều đó là thực tế. Ví dụ: với một ổ cứng ngoài duy nhất, điều đó có nghĩa là tôi có một ổ USB3 2,5 "duy nhất mà tôi đặt trong túi cùng với MacBook Pro để tôi có tổng dung lượng lưu trữ ngoài 2TB + 256GB.
Bất cứ điều gì có nhiều dư thừa sẽ nhất thiết phải thêm số lượng lớn để thiết lập. 2.5 "luôn là điểm hấp dẫn về tốc độ và dung lượng truyền so với số lượng lớn vật lý so với flash USB. Để dự phòng thích hợp, bây giờ tôi cần phải di chuyển xung quanh hai ổ đĩa ngoài. Tôi chỉ biết rằng cuối cùng tôi sẽ không thực hiện đúng cách, cắm cả hai vào.
Các cách khác để làm điều đó "tốt hơn" là các chương trình khác nhau có chi phí vô cùng đắt đỏ bằng tiền thật buộc một luồng công việc nhất định vào bạn hoặc giúp bạn sao lưu toàn bộ ổ đĩa. Tôi thường thấy rằng tôi không muốn bất kỳ điều này. Tuy nhiên, tôi vẫn sẵn sàng để đề xuất, đặc biệt là một số thứ giúp kiểm tra các tệp sau khi chuyển / sao lưu bằng cách băm.
Quay lại câu hỏi trong tầm tay. Trong Windows (7, 8, 8.1) hoặc OS X (10.8, 10.9) khi tôi nói với Explorer (hoặc Finder) với di chuyển một thư mục khổng lồ từ đĩa cục bộ đến đĩa gắn ngoài HĐH có băm các tập tin không sau khi sao chép, trước khi xóa nội dung gốc?
Dự đoán một số câu trả lời, Có, tôi biết về rsync. Có, tôi sử dụng Time Machine với đĩa cứng ngoài này tôi vừa đề cập (nó là phân vùng 500 GB trên đĩa 2TB). Tôi biết Time Machine sử dụng rsync dưới mui xe. Vấn đề là Time Machine sẽ bắt đầu mất đồ của bạn và bạn phải phân bổ một lượng không gian lớn hơn rất nhiều để mong đợi mọi điều để được phục hồi. Nếu bạn có tệp 4GB và chỉnh sửa 2 byte trong đó, Time Machine sẽ tiêu tốn thêm 4GB (và mất một lượng thời gian cần thiết để sao chép tất cả tệp đó) vào lần sao lưu tiếp theo. Đây chỉ là một vài trong số những phẩm chất mà tôi nhận thức được khiến cho cỗ máy thời gian không còn hoàn hảo. Mặc dù vậy, tôi khá vui khi để nó chơi xung quanh với phân vùng 500 GB.
Luồng các tệp quan trọng (bỏ qua tất cả mã nguồn đã có trong máy chủ Git) diễn ra như sau: Đầu tiên, nó chỉ trên đĩa cục bộ và cứ sau vài ngày lại đi vào phân vùng Time Machine. Cuối cùng, nó có thể biến mất khỏi phân vùng Time Machine khi nó lấp đầy và độ chi tiết của hình ảnh trong quá khứ bị giảm. Cứ sau vài tuần, tôi chọn thủ công các tệp chiếm nhiều không gian cục bộ nhưng tôi không thấy chính mình sử dụng và tôi di chuyển nó vào một phân vùng trên ổ đĩa ngoài. Bây giờ nó tồn tại dưới dạng một bản sao và chỉ sống trên ổ đĩa ngoài. Nếu tôi thực sự có thể cần dữ liệu này, tôi cũng lưu trữ dữ liệu ở một vị trí nữa.
Nếu thực sự đó là trường hợp nói với hệ điều hành di chuyển một tập tin không khiến nó xác minh nội dung khi giao hàng, sau đó tôi phải thay đổi hoàn toàn giao thức của mình. Điều này là do nếu phương tiện đích bị lỗi thì dữ liệu sẽ chắc chắn bị hỏng.
Trong quá trình viết câu hỏi này, tôi bắt đầu nghĩ rằng tôi đã hỏi sai câu hỏi. Có lẽ nó thông minh hơn nhiều khi chỉ cần luôn sử dụng hai mục tiêu sao lưu và thay đổi giao thức từ 1 di chuyển, 1 bản sao thành 2 bản sao và một lần xóa. Điều này tạo ra sự đảm bảo cao hơn về khả năng lưu giữ dữ liệu đầy đủ.
Tuy nhiên, thực hiện băm trước khi xóa / di chuyển cũng khá quan trọng, vì đó là cách duy nhất để biết rằng các phương tiện truyền thông mục tiêu không bị lỗi!
Có lẽ điều tôi muốn là GUI rsync, hoặc tốt hơn là các tiện ích mở rộng / plugin shell cho phép tôi thực hiện một hành động như "Sao chép và Hash" và "Di chuyển và Hash" khi tôi thực hiện sao chép / di chuyển thông thường với các thư mục của mình trong Explorer / Finder .
Cũng có một số biến thể về điều này: Với hai đĩa bên ngoài được cắm, tôi muốn phát hành "Sao chép vào 2 đích và Hash". Điều này sẽ ngăn dữ liệu nguồn bị băm không cần thiết hai lần như sẽ xảy ra với hai bản sao liên tiếp.