Có phải 5 GB hình ảnh jpeg mất cùng thời gian để tải xuống và / hoặc nhập dưới dạng 5 GB văn bản thuần túy không?


39

Chỉ tự hỏi, vì ngay bây giờ tôi đang nhập tất cả các hình ảnh của mình từ CD mà bố tôi đã đốt cho tôi. Tôi tò mò liệu 5 GB hình ảnh có cùng thời lượng với 5 GB văn bản khi thực hiện các loại chuyển này. Vì có thể có 'chi phí' được liên kết với các định dạng tệp khác nhau ngay cả khi chúng có cùng kích thước ...

chỉnh sửa: thực sự không phải là CD-rom mà là DVD-R


11
5 gig là 5 gig trừ khi nó không.
Xavierjazz

2
Không thể tranh luận với điều đó ...
Thomas Padron-McCarthy

35
Cái nào nặng hơn: một tấn gạch, hay một tấn lông?
Graham Borland

1
Xem câu trả lời của tôi (và những câu hỏi hay khác làm nổi bật các yếu tố khác nhau) trước khi loại bỏ điều này như một câu hỏi rõ ràng là xấu. 5GB có thể là 5GB, nhưng hiệu quả của đường ống dữ liệu truyền xuống tạo nên sự khác biệt.
David Stratton

1
@Graham: Cái nào nặng hơn, một pound lông hay một pound vàng? (câu trả lời)
BlueRaja - Daniel Pflughoeft

Câu trả lời:


75

Câu trả lơi con phụ thuộc vao nhiêu thư". Phụ thuộc vào những gì bạn có nghĩa là "tải về".

Nếu bạn đang tải xuống từ một trang web, hơn một số trang web sẽ tự động nén các tệp "nhanh chóng" và văn bản nén rất tốt, trong khi JPEG đã được nén, do đó nó sẽ không nén. Trong trường hợp này, sẽ có một sự khác biệt lớn.

Nếu bạn chỉ sử dụng lệnh sao chép để sao chép tệp từ máy tính này sang máy tính khác, thì sẽ không có sự khác biệt. Tuy nhiên, nếu bạn đang sử dụng một loại công cụ chuyên dụng nào đó, thì một lần nữa, nó phụ thuộc vào việc công cụ đó có sử dụng nén tự động hay không. Sự khác biệt duy nhất giữa jpeg và văn bản là khả năng nén các tệp.

Không có sự khác biệt trong 'chi phí chung' liên quan đến chuyển tập tin, bất kể tập tin là gì.


29
Trong trường hợp của một bản sao, nếu kích thước tổng thể là như nhau thì số lượng tệp có nhiều khả năng có tác động vì có quá nhiều chi phí trong việc chuyển siêu dữ liệu tệp / thư mục.
Chris Nava

2
@ chris-nava: Vâng, điều này rất đúng. Tôi chỉ xem xét các tệp có cùng kích thước, nhưng bạn đã đúng khi chỉ ra sắc thái này.
haimg

2
@DarkTemplar: nó bao gồm siêu dữ liệu. Gần như luôn luôn. Thông thường số lượng siêu dữ liệu được lưu trữ "bên ngoài" tệp khá hạn chế: tên tệp, quyền và một số lần truy cập. Nhiều hệ thống tệp có một tùy chọn để lưu trữ dữ liệu meta tùy ý (thậm chí lớn) "bên ngoài" tệp, nhưng điều đó hiếm khi được sử dụng.
Joachim Sauer

4
Cơ chế chuyển cũng có thể là một nguồn gây chậm trễ. Ví dụ SMB (Chia sẻ tệp Windows) là BAD khi chuyển số lượng lớn tệp nhỏ trong khi NFS hoặc FTP nhanh hơn nhiều cho cùng một bộ tệp.
Chris Nava

4
Tôi ngạc nhiên không ai đề cập đến khả năng chống vi-rút thêm vào một số chi phí đáng kể. Nhiều ứng dụng chống vi-rút quét các tệp JPEG để tìm vi-rút và bỏ qua các tài liệu văn bản. Điều này chắc chắn có thể đóng góp cho các yếu tố phụ thuộc .
Scott Rippey

17

Với 5GB hình ảnh, bạn có thể nói về một vài nghìn tệp có kích thước hợp lý, giả sử mỗi tệp 3MB. Nếu bạn đã tải xuống 5GB tệp văn bản, bạn thường mong đợi mỗi tệp sẽ nhỏ hơn rất nhiều. Vì vậy, bạn có thể xử lý một đơn đặt hàng có cường độ lớn hoặc hai tệp bổ sung (hàng trăm nghìn hoặc hàng triệu tệp).

Sao chép nhiều tệp nhỏ mất nhiều thời gian hơn so với sao chép cùng một lượng dữ liệu trong các tệp lớn hơn. Có một chi phí hợp lý trong việc tạo từng tệp riêng lẻ.

Không đủ để tạo ra một sự khác biệt lớn có lẽ, nhưng vẫn là một sự khác biệt.


3
Tôi nghĩ rằng điều này có thể tạo ra một sự khác biệt lớn. Sao chép một trăm tệp văn bản 30K chắc chắn có thể mất nhiều thời gian hơn so với sao chép một tệp 3 MB, tùy thuộc vào nơi bạn đang sao chép đến và đi.
Steven Noto

+1 Để giải quyết vấn đề thực sự ở đây. Cho đến nay câu trả lời tốt nhất.
artistoex

12

"Nó phụ thuộc" trong ftp là trong các chi tiết tốt.

ftp Chế độ nhị phân chỉ là một chuyển thẳng và sẽ mất thời gian cho 5GB.

Nếu bạn đang chuyển từ Windows sang Linux dưới dạng chuyển văn bản ftp (đáng ngạc nhiên là văn bản thuần túy), ftp thực sự thay đổi các kết thúc dòng từ / r / n thành / n và ngược lại. Có thể có một chút chi phí trong việc thay thế phát trực tuyến, nhưng với 5GB văn bản, bạn sẽ ít phải ghi vào đĩa hơn từ win sang lin khi bạn thả một ký tự trên mỗi dòng và nhiều hơn từ lin để giành chiến thắng khi bạn thêm một ký tự Mỗi dòng.

Vậy, nó có phải là 5GB trên Linux không? hay Windows?

Đủ thứ cho một đêm, đi ngủ!


Làm thế nào chúng ta có được FTP? OP dường như đang sao chép từ ổ đĩa DVD sang ổ đĩa cục bộ?
andynormancx

Từ tiêu đề. 'Twas đêm khuya và tôi đã trả lời câu hỏi, không phải đoạn dưới nó. Như đã làm poster bình chọn cao nhất trong các đoạn đầu tiên của mình. Bây giờ để sao chép từ phương tiện này sang phương tiện khác ...
Fiasco Labs

3

Không có chi phí liên quan đến bản thân các tệp, nhưng một số phương tiện lưu trữ / chuyển giao hỗ trợ nén tự động và điều đó có thể tạo ra sự khác biệt.

Khi sao chép từ DVD sang ổ đĩa không nén, không có sự khác biệt. Khi sao chép vào ổ đĩa NTFS đã nén, văn bản sẽ chiếm ít không gian hơn JPEG.

Khi tải xuống từ máy chủ HTTP sử dụng nén, văn bản sẽ mất ít thời gian hơn để tải xuống. Nhưng nếu máy chủ không sử dụng nén, sẽ không có sự khác biệt.

Ngoài ra, nói về chi phí chung, một triệu tệp nhỏ Tổng kích thước 5 GB sẽ chiếm nhiều dung lượng [thực tế] và thường mất nhiều thời gian hơn so với một tệp 5 GB, vì 5 GB đó không bao gồm dung lượng cần thiết để lưu trữ tên tệp, ngày và siêu dữ liệu khác .


3

Điều này có nghĩa là một bổ sung cho các câu trả lời khác về nén địa chỉ, vv là các yếu tố ảnh hưởng đến hiệu quả và thời gian tải xuống.

Một điểm chưa được đề cập là hiệu quả gói . Tôi nghi ngờ hầu hết mọi người thậm chí đã bắt gặp điều này, vì vậy đây là một chút nền tảng.

Trước khi mạo hiểm sử dụng các dịch vụ web, chúng tôi muốn biết sự khác biệt về hiệu quả giữa việc sử dụng chúng và sử dụng kết nối cơ sở dữ liệu "chuẩn" hơn (chẳng hạn như OleDb, System.Data.SqlClient, JDBC, v.v.). Chúng tôi đã có guru của chúng tôi đặt các trình thám thính gói để theo dõi các luồng dữ liệu trên mạng để thấy sự khác biệt.

Chúng tôi hy vọng rằng việc sử dụng các dịch vụ web sẽ kém hiệu quả hơn do định dạng nhị phân của các loại kết nối khác và chi phí bổ sung của các thẻ XML được sử dụng để mô tả dữ liệu.

Những gì chúng tôi tìm thấy là các dịch vụ web, trong nhiều trường hợp hiệu quả HƠN, ít nhất là trên mạng của chúng tôi. Sự khác biệt là khi truyền dữ liệu nhị phân, một số byte trong các gói trống, nhưng khi gửi dữ liệu văn bản, các gói được sử dụng hiệu quả hơn.

Chúng tôi thấy điều này thú vị và đã thử nó trong khi chuyển các loại tệp khác nhau và thấy rằng theo quy định, văn bản thuần túy đi qua mạng luôn sử dụng 100% bit có sẵn trong mỗi gói, trong đó chuyển nhị phân thường có các bit không được sử dụng. Tại sao lại như vậy, tôi không thể nói với bạn, nhưng một vài thí nghiệm đã cho thấy điều này.

Một số ý kiến ​​về câu hỏi dường như bỏ qua đây là một câu hỏi rõ ràng thiếu sót, nhưng thực sự không phải vậy. Mặc dù lượng dữ liệu vẫn giữ nguyên, hiệu quả của đường ống cũng rất quan trọng.

Bởi vì tôi không thể cưỡng lại việc tạo ra sự tương tự mà một người không phải CNTT sẽ hiểu:

Một kệ duy nhất trong tủ đông trong cửa hàng tạp hóa có x không gian, nhưng bạn có thể đặt nhiều gallon kem hơn trên kệ nếu các hộp vuông hơn bạn có thể nếu chúng bị tròn, vì không gian lãng phí được tạo ra bằng cách sử dụng vòng hộp đựng. Các thử nghiệm của chúng tôi, mặc dù lúc đầu phản trực giác, đã cho chúng tôi biết những gì mà bất kỳ người bán hàng tạp hóa nào cũng có thể nói với chúng tôi.


2
Cơ sở dữ liệu liên quan là gì? RDBMS khác nhau ít nhiều "hiệu quả mạng" hơn các mạng khác. Bạn đo từ thiết lập kết nối hoặc chỉ dữ liệu dữ liệu? Tôi thực sự tò mò.
Fabricio Araujo

1

Trí tuệ truyền thống nói rằng 5GB là 5GB. Tuy nhiên, có một số tình huống mà hai cái này không giống nhau; nó có liên quan đến sự khác biệt trong cách cấu trúc dữ liệu của các tệp.

Trước hết, JPEG được nén. Để xem hình ảnh, trước tiên, tệp phải được giải nén và đối với phần lớn các hình ảnh đó, bạn phải có toàn bộ tệp để thực hiện việc này. Có những JPEG tiến bộ cung cấp hình ảnh lặp lại sắc nét hơn khi được tải, nhưng chúng hiếm khi được sử dụng nữa trong thời đại mà DSL và các kết nối tốc độ cao khác rất phổ biến. Văn bản, mặt khác, ít nhiều có thể truyền phát; ngay khi bạn có một byte (hoặc hai hoặc bốn, tùy thuộc vào mã hóa UTF được sử dụng), bạn có thể hiển thị ký tự đó. Ngay cả các cơ chế truyền dữ liệu lâu đời nhất cũng có thể tải văn bản nhanh hơn bạn có thể đọc nó. Vì vậy, JPEG 5GB sẽ mất nhiều thời gian hơn để có thể hiển thị nội dung nào đó hơn tệp văn bản 5 GB.

Thứ hai, cũng vì JPEG được nén, chúng không hoạt động tốt với trình duyệt hoặc chương trình / giao thức truyền tệp nén một lượng lớn dữ liệu trước khi truyền. Bạn có thể thấy điều này bằng cách ZIP một tập tin ZIP; trừ khi quy trình ZIP thứ hai được cấu hình để thực hiện nén nhiều hơn (làm chậm nó), bạn sẽ không thấy nhiều sự khác biệt về kích thước. Điều đó có nghĩa là khi sử dụng một trong những công cụ này, 5GB không phải là 5GB; JPEG vẫn còn khoảng 5GB, nhưng văn bản có thể được nén, có thể xuống tới 1GB hoặc ít hơn. Nếu bạn so sánh 5GB tệp bitmap với 5GB văn bản thuần thì việc so sánh sẽ gần hơn nhiều.

Tuy nhiên, chỉ cần di chuyển 5GB tệp từ máy tính này sang máy tính khác bằng NTP, FTP hoặc HTTP, mà không sử dụng bất kỳ cơ chế nén hoặc "doanload booster" nào, sẽ mất khoảng thời gian chung; bất kỳ sự khác biệt nào cũng sẽ là kết quả của các mức lưu lượng mạng khác nhau ở bất kỳ giây nào trong mỗi lần chuyển.


Tôi chưa bao giờ nghe nói về JPG xen kẽ. Bạn có đang kết hợp JPG lũy tiến với GIF / PNG xen kẽ không?
fluffy

Biến thể "JPEG lũy tiến" là một định dạng xen kẽ giống như GIF / PNG xen kẽ. Thuật ngữ "lũy tiến" cho JPEG gây nhầm lẫn IMO, vì các thuật ngữ nổi tiếng như "quét lũy tiến", "720p (rogressive)" và "1080p". Tất cả các thuật ngữ đó chỉ ra rằng toàn bộ khung hình được vẽ ở độ phân giải đầy đủ trong một lần thay vì trong hai lần xen kẽ, trái ngược hoàn toàn với hành vi hiển thị JPEG "lũy tiến".
KeithS

1
Nhưng đó không phải là cách JPEG hoạt động. Đây không phải là định dạng xen kẽ / xen kẽ như GIF hoặc PNG (hoặc video DVD, đối với vấn đề đó), đó là một sàng lọc lặp lại của các khối DCT. Một JPEG lũy tiến đang tiến hành có độ bao phủ pixel đầy đủ - nó chỉ ở tốc độ bit thấp hơn. JPEG cũng không xử lý mọi thứ trong các đường quét như GIF hoặc PNG, nó xử lý chúng như một tập hợp các nhóm pixel vuông.
lông mịn

Cà chua, cà chua. Hình ảnh ban đầu được hiển thị bằng một tập hợp con của dữ liệu hình ảnh đầy đủ xuất hiện sớm, sau đó được tinh chỉnh với phần còn lại của nó. Đó là quan điểm của tôi. Cho dù đó là dòng hay chặn, đó là kiểu tải nhiều lượt, trái ngược với kiểu một lượt.
KeithS

Đó không chỉ là một sự khác biệt về thuật ngữ nhỏ như bạn ngụ ý, mà điều này đang biến thành một cuộc tranh luận tường gạch không có lý do chính đáng. Tôi chỉ cố gắng đề xuất một chỉnh sửa nhỏ cho bạn để thực hiện câu trả lời của bạn, không cố gắng vào một trận đấu tức giận.
fluffy

0

5 GB từ ổ đĩa quang phải giống nhau - nếu JPG hoặc văn bản. Được truyền qua mạng, tôi nhớ thời gian của các modem, tùy thuộc vào phần cứng, nén tích hợp, do đó, JPG 5 GB đã được nén sẽ không bị nén thêm, nhưng văn bản 5 GB thường có nhiều tiềm năng cho nén.

Vậy tại sao cái này không được sử dụng cho ổ cứng? Có lẽ bạn sẽ cần quá nhiều logic trên ổ cứng, quá dễ bị nén khi làm nóng ổ cứng quá nhiều và quá dễ để nén dữ liệu một cách rõ ràng, nếu muốn? Có lẽ nó tồn tại cho một số ổ đĩa?

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.