Làm thế nào để kiểm tra các tập tin có nội dung độc đáo?
if diff "$file1" "$file2" > /dev/null; then
...
Làm thế nào chúng ta có thể nhận được danh sách các tập tin trong thư mục?
files="$( find ${files_dir} -type f )"
Chúng tôi có thể nhận bất kỳ 2 tệp nào từ danh sách đó và kiểm tra xem tên của chúng có khác nhau không và nội dung có giống nhau không.
#!/bin/bash
# removeDuplicates.sh
files_dir=$1
if [[ -z "$files_dir" ]]; then
echo "Error: files dir is undefined"
fi
files="$( find ${files_dir} -type f )"
for file1 in $files; do
for file2 in $files; do
# echo "checking $file1 and $file2"
if [[ "$file1" != "$file2" && -e "$file1" && -e "$file2" ]]; then
if diff "$file1" "$file2" > /dev/null; then
echo "$file1 and $file2 are duplicates"
rm -v "$file2"
fi
fi
done
done
Ví dụ: chúng tôi có một số thư mục:
$> ls .tmp -1
all(2).txt
all.txt
file
text
text(2)
Vì vậy, chỉ có 3 tập tin duy nhất.
Hãy chạy tập lệnh đó:
$> ./removeDuplicates.sh .tmp/
.tmp/text(2) and .tmp/text are duplicates
removed `.tmp/text'
.tmp/all.txt and .tmp/all(2).txt are duplicates
removed `.tmp/all(2).txt'
Và chúng tôi chỉ nhận được 3 tập tin.
$> ls .tmp/ -1
all.txt
file
text(2)