Mất 1,5TB dữ liệu để sao chép phụ thuộc rất nhiều vào loại dữ liệu. Nếu bạn có vài 1.500 tệp 1GB, có thể sẽ chỉ mất vài giờ, nhưng nếu bạn có một tỷ rưỡi tệp 1KB thì có thể sẽ mất vài ngày.
Điều này là do hai thông số kỹ thuật cạnh tranh trên đĩa: thông lượng và thời gian truy cập trung bình. Một đĩa truyền thống có thông lượng 100MB / giây và thời gian truy cập 10ms là khá phổ biến. Nếu bạn có thể truyền dữ liệu tuần tự, bạn có thể nhận được 100MB / giây. Tuy nhiên, nếu bạn cần phải nhảy đến một nơi khác thì phải mất 10ms. Nếu bạn đã phát trực tuyến, bạn có thể đã ghi 1MB dữ liệu trong thời gian cần thiết để chuyển đến một vị trí khác.
Việc tạo một tệp có thể mất vài lần tìm kiếm, do đó, việc tạo tệp 1KB có thể "tốn" nhiều như truyền một vài MB dữ liệu.
Vì vậy, trong một số trường hợp, tốt hơn là thực hiện sao chép đĩa thô của thiết bị khối hơn là sao chép tại hệ thống tệp thông qua một cái gì đó như rsync. Nếu bạn có rất nhiều tệp, trong một hệ thống tệp có nghĩa là đầy đủ 50% trở lên, bạn thường chỉ nên sao chép thiết bị khối đầy đủ thông qua "dd", theo thời gian cần thiết. Tất nhiên, bạn không thể làm điều này trong khi hệ thống tệp được gắn kết, vì vậy điều này cũng có nhược điểm.
SSD có thể giúp giảm thiểu điều này, vì thời gian truy cập của chúng nhanh gấp khoảng 100 lần, nhưng ổ SSD MLC có vấn đề truy cập phức tạp tùy thuộc vào sự sẵn có của một khối các khối bị xóa trước. SSD SLC có thể giúp điều này.
Bộ điều khiển RAID với bộ đệm tích hợp có thể giúp tìm kiếm, cũng như mô-đun hạt nhân flashcache cho phép bạn lưu trữ thiết bị khối thông qua ổ SSD.
Các hệ thống RAID có thể cho phép nhiều tìm kiếm song song, giảm hiệu quả thời gian truy cập trung bình và cũng có thể song song hóa để tăng thông lượng. Nhưng hiệu suất tổng thể của bạn thường sẽ phụ thuộc vào số lượng tệp có liên quan.