Là nhanh hơn để nén các tập tin trước khi sao chép? [bản sao]


2

Câu hỏi này đã có câu trả lời ở đây:

Tôi có khoảng 80 GB dữ liệu tôi cần sao chép vào ổ cứng ngoài. Nó sẽ nhanh hơn để nén tất cả các tập tin đầu tiên và sau đó sao chép lại? Hay thời gian để nén và giải nén sẽ mất nhiều thời gian hơn mà thời gian sao chép sẽ tiết kiệm?

Tôi sẽ cài đặt lại windows để về cơ bản là tài liệu, hình ảnh, video, v.v. Và có 28.284 tệp.

Ngoài ra bất kỳ con trỏ nào tôi nên cảnh giác trước khi tôi bắt đầu có thể tăng tốc quá trình?


Câu hỏi của bạn rất mơ hồ vì (1) bạn có nhiều thuật toán nén khác nhau, mỗi thuật toán có đặc điểm tốc độ / hiệu suất; (2) khi nào giải nén? I E. bạn sẽ ghi / lưu các tệp nén để lưu trữ lâu dài chứ? BTW hầu hết các tệp video và âm thanh đã sử dụng sơ đồ nén và không nén thêm nữa.
sawdust

Không hẳn vậy. Câu hỏi được liên kết là về nén khi sao chép qua mạng , trong trường hợp một số loại kỹ thuật nén thực sự có thể có ý nghĩa mà đơn giản là không thể đối với kết nối giống như lưu trữ lớn.
Vucar Timnärakrul

Tôi khuyên bạn nên tự định thời gian nếu bạn có thiết bị. Vấn đề là không có câu trả lời chính xác cho điều này; phụ thuộc vào số lượng tệp và kích cỡ của tệp. Ít nhất là với các hệ thống tệp Windows, hàng chục ngàn tệp nhỏ có tổng dung lượng 80 GB sẽ mất nhiều thời gian so với vài tệp lớn.
icelava

Câu trả lời:


-2

Trả lời cho bạn: không. Nó chỉ nhanh hơn nếu bạn chỉ để lại một tệp bị xóa ở định dạng nén trên tệp bên ngoài. Nhưng nếu bạn giải nén tập tin trên cùng một khó khăn, nó sẽ bị chậm. Nhân tiện, bạn có những tập tin nào, và bạn có bao nhiêu tập tin?


Tôi sẽ cài đặt lại windows để về cơ bản là tài liệu, hình ảnh, video, v.v. Và có 28.284 tệp.
tysonsmiths

Tài liệu, hình ảnh và video? Don Patrick thậm chí còn bận tâm, hoàn toàn lãng phí thời gian. Chỉ cần bắt đầu chuyển và xem một bộ phim và hy vọng việc chuyển tiền đi qua. Tôi vẫn còn sử dụng rsync, nhưng nếu nó là một hoạt động one-shot thì có lẽ nó không đáng để gặp rắc rối.
Vucar Timnärakrul

5

Tôi giả sử rằng ổ đĩa ngoài của bạn được kết nối qua USB, eSATA, Firewire hoặc tương tự. Trong bất kỳ trường hợp nào, ổ đĩa sẽ xuất hiện trên máy chủ dưới dạng một thiết bị khối và máy chủ sẽ nói chuyện với đĩa cứng như thể nó là một ổ cứng bên trong. Đó là toàn bộ quan điểm của việc có lớp thiết bị lưu trữ dung lượng lớn ‘USB.

Điều này cũng có nghĩa là dữ liệu phải được đẩy lên dây theo cách chính xác mà chúng dự định hiển thị trên đĩa cứng. Không có chương trình nào nén dữ liệu trên máy chủ, gửi nén dữ liệu qua kết nối USB và sau đó được giải nén trong suốt ngay trước khi dữ liệu thô, không nén được lưu trữ trên phương tiện vật lý. Vì vậy, bạn phải nén dữ liệu trước, trên đĩa nguồn hoặc nhảy qua các yếu tố (ví dụ: đặt NAS ở giữa và sử dụng giao thức mạng nén).

Tóm lại, trừ khi bạn có dữ liệu rất cụ thể có khả năng nén tốt, thì nó có khả năng là bạn sẽ nhận được tỷ lệ nén rất tệ. Nếu phần lớn 80 GB được làm từ video, hình ảnh và những thứ tương tự, bạn thậm chí có thể nhận được tỷ lệ âm, vì chúng đã được nén rất cao bằng các thuật toán rất chuyên dụng.

Trong mọi trường hợp, nhận được bất kỳ tỷ lệ nén đáng kể phát sinh nặng số lượng thời gian CPU. Bạn có thể có được ước tính sơ bộ về mức độ tệ của nó bằng một thử nghiệm đơn giản: Chỉ cần thử nén bất kỳ tệp 1 GB nào với 7zip ở cài đặt cao nhất và đo thời gian. Sau đó đo khoảng thời gian cần thiết giải nén kết quả.

Hầu hết các thuật toán nén đều được tối ưu hóa cho tốc độ giải nén, vì điều đó thường được thực hiện thường xuyên hơn. Tuy nhiên, sẽ có một hình phạt hiệu suất đáng chú ý hoặc thậm chí đáng kể và bạn sẽ phải trả tiền phạt đó mỗi khi bạn truy cập dữ liệu nén.

Hay thời gian để nén và giải nén sẽ mất nhiều thời gian hơn mà thời gian sao chép sẽ tiết kiệm?

Ngoài ra bất kỳ con trỏ nào tôi nên cảnh giác trước khi tôi bắt đầu có thể tăng tốc quá trình?

Nếu tất cả những gì bạn muốn thực hiện là đưa dữ liệu từ ổ đĩa nguồn của bạn sang ổ đĩa ngoài, thì bản sao rất có thể đã hoàn thành trước thời điểm bạn nhận được câu trả lời ở đây. : o) Đặc biệt là vì 80 GB không còn là vấn đề lớn nữa; giả sử số sân bóng là 10 MB / s, bạn sẽ đợi ít hơn ba giờ. Nén 80 GB sẽ mất nhiều lâu hơn.


Cái gì đó làm công đức xem xét mặc dù là chuyển bị gián đoạn . Phải khởi động lại việc chuyển 80 GB ở mức 95% và phải khởi động lại từ đầu là khó chịu, phải nói là ít nhất. Công cụ kinh điển trong trường hợp này là rsync, có thể giúp bạn tiết kiệm thời gian rất nhiều, nhiều hơn việc nén có thể mang lại cho bạn. Giá là một khoản đầu tư nhỏ vào cách sử dụng nó, nhưng bạn sẽ không bị phạt hiệu suất khi đọc dữ liệu sau đó, đây là một điểm cộng lớn.

TL; DR: Từ những gì tôi thu thập được từ câu hỏi của bạn, rsync (hoặc tương tự) là con đường để đi. Ngoại trừ trường hợp rất cụ thể, nén sẽ là một sự lãng phí lớn thời gian.


1

Có và không. Nó thực sự phụ thuộc vào những gì bạn đang nén và phương pháp nén là gì. 80GB dữ liệu có thể đáng để nén NẾU nó vẫn ở trạng thái nén đó. Nếu bạn đang muốn truy cập nhanh vào dữ liệu đó thì không, việc nén sẽ chỉ cản trở khả năng đó. Thực sự nén không phải là quá nhiều phần mềm vì nó là phần cứng vì nó phụ thuộc vào hiệu suất của máy chủ hoặc máy tính mà bạn đang nén.

Thực sự cuối cùng bạn sẽ tiết kiệm thời gian cho mình bằng cách chỉ sao chép dữ liệu thô và không nén mà không thực sự là nén được thiết kế cho.


1

Điều này phụ thuộc hoàn toàn vào loại dữ liệu bạn đang sao lưu và thiết bị bạn cũng đang sao lưu. Tôi có một lượng lớn dữ liệu có khả năng nén cao mà tôi thường xuyên sao lưu vào ổ USB 2. Nén dữ liệu giúp tăng tốc đáng kể việc truyền tải vì USB 2 chậm hơn đáng kể thời gian cần thiết để nén dữ liệu và tiết kiệm rất lớn.

Ngược lại, nếu bạn có ổ USB3 nhanh hoặc dữ liệu nén, bạn sẽ nhận được ít lợi thế hơn.

Loại nén bạn sử dụng cũng cần phải được tính đến, cũng như CPU ​​của bạn. Zip và tương tự là tương đối nhẹ, vì vậy nén rất nhanh, tuy nhiên một số thuật toán nén tốn nhiều CPU hơn.

Tôi là một người dùng linux, vì vậy tôi chưa sử dụng nó, nhưng bạn có thể tận dụng tốt nhất cả hai thế giới (tức là các tài liệu dễ truy cập, thời gian viết nhanh hơn) bằng cách sử dụng Nén NTFS trên hệ thống tập tin của bạn.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.