Là lệnh của tôi để sao chép một ổ đĩa tối ưu?


16

Tôi đã thực hiện nửa giờ đọc xung quanh để chuẩn bị sao chép ổ cứng của mình. Nó có nhiều phân vùng, bao gồm cả phân vùng Windows. Tôi sẽ mua một ổ cứng ngoài rất lớn để sao lưu. Tôi muốn có thể sử dụng bản sao này để khôi phục toàn bộ ổ đĩa trong trường hợp có sự cố (tôi sắp thực hiện một số thao tác xáo trộn hệ điều hành). Tôi muốn học cách làm điều này bằng cách sử dụng dd, vì tôi thích các công cụ cấp thấp không yêu cầu cài đặt bất cứ thứ gì.

Tôi đã tìm thấy mã hữu ích sau từ các diễn đàn ubfox (được nhập từ shell root bằng đĩa CD trực tiếp):

dd if=/dev/hda of=/dev/hdb & pid=$!
while kill -USR1 $pid; do sleep 1; done

(Tôi biết rằng tôi sẽ phải chỉnh sửa vị trí đầu vào và đầu ra.) Tuy nhiên tôi có hai câu hỏi. Cái đầu tiên rất noobie: lệnh này được chia thành hai dòng. Chắc chắn khi tôi nhấn enter sau dấu chấm than nó sẽ bắt đầu quá trình?

Hai, trên các trang web khác, nó khuyến nghị nhập kích thước khối. Như thế này:

# dd if=/dev/hda conv=sync,noerror bs=64K of=/mnt/sda1/hda.img

Tôi không biết gì về kích thước khối. Là 64K phải không? Có vẻ như kích thước khối của tôi là 512 byte từ sau, đầu ra của sudo fdisk -ul:

Disk /dev/sda: 750.2 GB, 750156374016 bytes
255 heads, 63 sectors/track, 91201 cylinders, total 1465149168 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0xc3ffc3ff

   Device Boot      Start         End      Blocks   Id  System
/dev/sda1   *          63   143364059    71681998+   7  HPFS/NTFS/exFAT
Partition 1 does not start on physical sector boundary.
/dev/sda2       976867328  1465147391   244140032    7  HPFS/NTFS/exFAT
/dev/sda3       143364094   976867327   416751617    5  Extended
Partition 3 does not start on physical sector boundary.
/dev/sda5       143364096   162895871     9765888   82  Linux swap / Solaris
/dev/sda6       162897920   205864959    21483520   83  Linux
/dev/sda7       205867008   976867327   385500160   83  Linux

Partition table entries are not in disk order

Disk /dev/mapper/cryptswap1: 10.0 GB, 10000269312 bytes
255 heads, 63 sectors/track, 1215 cylinders, total 19531776 sectors
Units = sectors of 1 * 512 = 512 bytes
Sector size (logical/physical): 512 bytes / 4096 bytes
I/O size (minimum/optimal): 4096 bytes / 4096 bytes
Disk identifier: 0x433bb3a7

Disk /dev/mapper/cryptswap1 doesn't contain a valid partition table

Cảm ơn bạn.


Bạn đã thử một cách đơn giản dd if=/dev/hda of=hdb? Dưới đây là câu trả lời cho thấy một số chi tiết bao gồm thời gian chạy cho 160 GB: askubfox.com/questions/435694/ mẹo
SDsolar

Các phiên bản gần đây của Ubuntu sử dụng coreutils v.8.24 trở lên, trong đó ddbao gồm một công tắc tiến trình như được đề cập ở đây
Elder Geek

Câu trả lời:


22

Phát triển

Lệnh bạn đã liệt kê

dd if=/dev/hda of=/dev/hdb & pid=$!
while kill -USR1 $pid; do sleep 1; done

là một hai lớp lót tốt đẹp để có được sự tiến bộ ddmột cách thường xuyên. Tôi sử dụng một cái rất giống nhau quá. Có vẻ tốt. Tìm thấy nó ở đây có lẽ?

Chặn với dd: căn chỉnh và hiệu suất

Bạn có thể thêm kích thước khối trong đó các hoạt động diễn ra. Không quan trọng kích thước khối của thiết bị khối bên dưới là gì để hoạt động được thực hiện tốt như nhau, nhưng vì lý do hiệu suất, bạn có thể muốn chọn một thiết bị phù hợp với nhu cầu của mình.

Trước hết, có điều liên kết . Trong trường hợp thiết bị khối của bạn hoạt động như 512KiB (giống như ổ đĩa flash), sẽ rất không may khi chạy ddvới bs=512(byte) vì điều này sẽ gây ra 1024 lần ghi (!) Cho mỗi khối từ phối cảnh thiết bị. Trong thực tế, điều này sẽ không tệ như vậy khi các bài viết được đệm và đưa vào một lần, nhưng trong quá trình đồng bộ hóa, nó vẫn có thể khuếch đại số lượng bài viết rất nhiều.

Sau đó, cũng xem xét chi phí sử dụng CPU đơn giản khi xử lý một lượng lớn các hoạt động nhỏ. Sẽ hiệu quả hơn khi lấy megabyte cùng một lúc khi sao chép lượng lớn dữ liệu.

Cách tốt nhất của tôi là bắt đầu với 1MB vì ​​đó là một số lượng lớn các thiết lập, bao gồm kích thước sọc RAID, kích thước phạm vi LVM, v.v. đừng nhìn thấy nó nữa trên ổ cứng vật lý của tôi.

Khối cuối cùng

Đừng lo lắng về kích thước ổ đĩa / âm lượng không phải là bội số của kích thước khối. Khối cuối cùng ddsẽ sao chép sẽ được điều chỉnh để khớp với bit dữ liệu cuối cùng trên đó. Bạn có thể xem liệu khối cuối cùng có kích thước khác hay không bằng cách nhìn vào đầu ra.

18335302+0 records out

Điều +0đó có nghĩa là đó là một trận đấu chính xác, +1có nghĩa là không. Không vấn đề gì.

Xem thêm


1
Wow, thật là một câu trả lời thấu đáo. Cảm ơn bạn rất nhiều vì đã dành thời gian để làm điều đó. Tôi sẽ cập nhật câu hỏi ban đầu với một liên kết đến nguồn của tôi. Tôi sẽ đi với 1 MB rồi. Vì vậy, lệnh của tôi sẽ như thế này, phải không? # dd if=/dev/hda conv=sync,noerror bs=1MB of=/mnt/sda1/hda.img & pid=$! while kill -USR1 $pid; do sleep 1; done
Kit Johnson

2
@oldmankit Tôi sẽ làm bs=1Mnhư đó là sức mạnh của 2, thay vì bs=1MBlà sức mạnh của 10. Nhưng chỉ cần chạy một số điểm chuẩn trên hệ thống của bạn nếu bạn có thể thấy điều gì là tốt nhất.
gertvdijk

4
Lưu ý rằng như đã đề cập ở đây kể từ khi phát hành coreutils> = 8.24 (mặc định trong Ubuntu Xenial 16.04 trở lên), kill -USR1 $pidbây giờ không còn cần thiết phải có báo cáo tiến trình bằng cách thêm công status=progresstắc
Elder Geek

10

Như những người khác đã nói, không có kích thước khối chính xác toàn cầu; những gì là tối ưu cho một tình huống hoặc một phần cứng có thể không hiệu quả khủng khiếp cho một tình huống khác. Ngoài ra, tùy thuộc vào sức khỏe của các đĩa, có thể nên sử dụng kích thước khối khác với mức "tối ưu".

Một điều khá đáng tin cậy trên phần cứng hiện đại là kích thước khối mặc định 512 byte có xu hướng gần như là một thứ tự cường độ chậm hơn so với một sự thay thế tối ưu hơn. Khi nghi ngờ, tôi đã thấy rằng 64K là một mặc định hiện đại khá vững chắc. Mặc dù 64K thường không phải là kích thước khối tối ưu, nhưng theo kinh nghiệm của tôi, nó có xu hướng hiệu quả hơn nhiều so với mặc định. 64K cũng có một lịch sử khá vững chắc về hiệu suất đáng tin cậy: Bạn có thể tìm thấy một tin nhắn từ danh sách gửi thư của Eug-Lug , khoảng năm 2002, khuyến nghị kích thước khối là 64K.

Để xác định kích thước khối đầu ra tối ưu, tôi đã viết đoạn mã sau kiểm tra việc ghi tệp thử nghiệm 128M với dd ở một phạm vi kích thước khối khác nhau, từ mặc định 512 byte đến tối đa 64M. Được cảnh báo, tập lệnh này sử dụng dd trong nội bộ, vì vậy hãy thận trọng khi sử dụng.

dd_obs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_obs_testfile}
TEST_FILE_EXISTS=0
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=1; fi
TEST_FILE_SIZE=134217728

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Calculate number of segments required to copy
  COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))

  if [ $COUNT -le 0 ]; then
    echo "Block size of $BLOCK_SIZE estimated to require $COUNT blocks, aborting further tests."
    break
  fi

  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Create a test file with the specified block size
  DD_RESULT=$(dd if=/dev/zero of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync 2>&1 1>/dev/null)

  # Extract the transfer rate from dd's STDERR output
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  # Clean up the test file if we created one
  if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

  # Output the result
  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

Xem trên GitHub

Tôi chỉ thử nghiệm tập lệnh này trên hệ thống Debian (Ubuntu) và trên OSX Yosemite, vì vậy có lẽ sẽ cần một số điều chỉnh để thực hiện các hương vị Unix khác.

Theo mặc định, lệnh sẽ tạo một tệp thử nghiệm có tên dd_obs_testfiletrong thư mục hiện tại. Ngoài ra, bạn có thể cung cấp đường dẫn đến tệp thử nghiệm tùy chỉnh bằng cách cung cấp đường dẫn sau tên tập lệnh:

$ ./dd_obs_test.sh /path/to/disk/test_file

Đầu ra của tập lệnh là một danh sách các kích thước khối được kiểm tra và tốc độ truyền tương ứng của chúng như sau:

$ ./dd_obs_test.sh
block size : transfer rate
       512 : 11.3 MB/s
      1024 : 22.1 MB/s
      2048 : 42.3 MB/s
      4096 : 75.2 MB/s
      8192 : 90.7 MB/s
     16384 : 101 MB/s
     32768 : 104 MB/s
     65536 : 108 MB/s
    131072 : 113 MB/s
    262144 : 112 MB/s
    524288 : 133 MB/s
   1048576 : 125 MB/s
   2097152 : 113 MB/s
   4194304 : 106 MB/s
   8388608 : 107 MB/s
  16777216 : 110 MB/s
  33554432 : 119 MB/s
  67108864 : 134 MB/s

(Lưu ý: Đơn vị của tốc độ truyền sẽ thay đổi theo HĐH)

Để kiểm tra kích thước khối đọc tối ưu, bạn có thể sử dụng ít nhiều cùng một quy trình, nhưng thay vì đọc từ /dev/zerovà ghi vào đĩa, bạn sẽ đọc từ đĩa và ghi vào /dev/null. Một kịch bản để làm điều này có thể trông giống như vậy:

dd_ibs_test.sh:

#!/bin/bash

# Since we're dealing with dd, abort if any errors occur
set -e

TEST_FILE=${1:-dd_ibs_testfile}
if [ -e "$TEST_FILE" ]; then TEST_FILE_EXISTS=$?; fi
TEST_FILE_SIZE=134217728

# Exit if file exists
if [ -e $TEST_FILE ]; then
  echo "Test file $TEST_FILE exists, aborting."
  exit 1
fi
TEST_FILE_EXISTS=1

if [ $EUID -ne 0 ]; then
  echo "NOTE: Kernel cache will not be cleared between tests without sudo. This will likely cause inaccurate results." 1>&2
fi

# Create test file
echo 'Generating test file...'
BLOCK_SIZE=65536
COUNT=$(($TEST_FILE_SIZE / $BLOCK_SIZE))
dd if=/dev/urandom of=$TEST_FILE bs=$BLOCK_SIZE count=$COUNT conv=fsync > /dev/null 2>&1

# Header
PRINTF_FORMAT="%8s : %s\n"
printf "$PRINTF_FORMAT" 'block size' 'transfer rate'

# Block sizes of 512b 1K 2K 4K 8K 16K 32K 64K 128K 256K 512K 1M 2M 4M 8M 16M 32M 64M
for BLOCK_SIZE in 512 1024 2048 4096 8192 16384 32768 65536 131072 262144 524288 1048576 2097152 4194304 8388608 16777216 33554432 67108864
do
  # Clear kernel cache to ensure more accurate test
  [ $EUID -eq 0 ] && [ -e /proc/sys/vm/drop_caches ] && echo 3 > /proc/sys/vm/drop_caches

  # Read test file out to /dev/null with specified block size
  DD_RESULT=$(dd if=$TEST_FILE of=/dev/null bs=$BLOCK_SIZE 2>&1 1>/dev/null)

  # Extract transfer rate
  TRANSFER_RATE=$(echo $DD_RESULT | \grep --only-matching -E '[0-9.]+ ([MGk]?B|bytes)/s(ec)?')

  printf "$PRINTF_FORMAT" "$BLOCK_SIZE" "$TRANSFER_RATE"
done

# Clean up the test file if we created one
if [ $TEST_FILE_EXISTS -ne 0 ]; then rm $TEST_FILE; fi

Xem trên GitHub

Một sự khác biệt quan trọng trong trường hợp này là tệp thử nghiệm là một tệp được viết bởi tập lệnh. Không trỏ lệnh này vào một tệp hiện có hoặc tệp hiện có sẽ bị ghi đè bằng dữ liệu ngẫu nhiên!

Đối với phần cứng cụ thể của tôi, tôi thấy rằng 128K là kích thước khối đầu vào tối ưu nhất trên ổ cứng và 32K là tối ưu nhất trên ổ SSD.

Mặc dù câu trả lời này bao gồm hầu hết các phát hiện của tôi, tôi đã cần xác định kích thước khối dd tối ưu đủ số lần tôi viết một bài đăng trên blog về nó. Bạn có thể tìm thấy chi tiết cụ thể hơn về các bài kiểm tra tôi đã thực hiện ở đó.

Bài đăng StackOverflow này cũng có thể hữu ích: dd: Làm thế nào để tính toán kích thước khối tối ưu?


Dạy một người đàn ông câu cá = +1
HackSlash

@ tdg5 Đây là một tập lệnh tuyệt vời, nhưng nó gặp phải lỗi nghiêm trọng khi được thực thi từ bên trong Cygwin trên môi trường Windows 7. Có phiên bản nào của nó sẽ hoạt động trên Cygwin không?
Hashim
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.