Tôi sắp xếp lại rất nhiều tệp PDF mỗi ngày, vì vậy tôi dành nhiều thời gian để suy nghĩ làm thế nào để làm điều đó một cách tốt nhất.
Đối với tôi cách tốt nhất là chia PDF thành tệp PDF 1 trang, bên cạnh chỉnh sửa bằng GIMP, bên cạnh để kết hợp nó. Tôi không sử dụng hình ảnh trên tất cả các tệp (tôi hoàn toàn không sử dụng), vì vậy tôi không mất lớp văn bản trên tất cả các trang, mà chỉ được xử lý lại. Không tải toàn bộ tệp PDF cùng một lúc, vì nó gây cạn kiệt bộ nhớ.
Tách PDF thành tập tin 1 trang
Dễ dàng phân chia các tệp PDF thành PDF 1 trang mà bạn có thể bằng hàm bash này (đặt nó vào ~ / .bashrc):
function pdf_split(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
done;
};
Bây giờ bạn có thể nhập split_pdf file.pdf
để có được nhiều tệp PDF.
Làm lại tập tin
Nhưng, bây giờ bạn cần chỉnh sửa tất cả các tập tin này. Bạn có thể làm điều đó với gimp original-filename-*.pdf
. Tôi đề nghị cấu hình phím tắt trong GIMP (Cửa sổ chính-> Chỉnh sửa-> Phím tắt) để thay thế tệp (Tôi sử dụng CTRL + R), bộ lọc mờ (ví dụ: CTRL + D), đóng tệp (ví dụ: CTRL + W) và thoát GIMP ( ví dụ.CTRL + Q). Hãy nhớ không tải GIMP vào nhiều tệp cùng một lúc, nhưng GIMP khi bạn tải sau khi mở, để bạn có thể sử dụng gimp original-filename-*.pdf
an toàn trên hàng ngàn tệp.
Kết hợp các tập tin
Bạn có thể kết hợp các tệp dễ dàng với: pdftk originam-filename-*.pdf cat output "new-file-anon.pdf";
Kết nối tất cả lại với nhau
Các thao tác này rất lặp đi lặp lại và nhàm chán, vì vậy tôi kết nối tất cả trong 1 tập lệnh:
function pdf_redact(){
for file in "$@"; do
if [ "${file##*.}" != "pdf" ]; then
echo "Skip $file because it's not PDF file";
continue
fi;
pages=$(pdfinfo "$file" | grep "Pages" | awk '{print $2}')
echo "Detect $pages in $file";
filename="${file%.*}";
unset Outfile;
for i in $(seq 1 "$pages"); do
pdftk "$file" cat "$i" output "$filename-$i.pdf";
Outfile[$i]="$filename-$i.pdf";
done;
gimp "${Outfile[@]}";
pdftk "${Outfile[@]}" cat output "$filename-anon.pdf";
rm "${Outfile[@]}";
read -p "Do you want open output file? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
evince "$filename-anon.pdf";
fi
read -p "Do you want upload output file to Scribd.com? " -n 1 -r
echo
if [[ $REPLY =~ ^[Yy]$ ]]
then
scribd_up "$filename-anon.pdf";
fi
done;
};
Phiên bản mới nhất của tập lệnh này luôn có thể truy cập tại: http://dostep.jawne.info.pl/it/bashrc
Nhớ đóng GIMP (CTRL + Q) sau khi tất cả các lần rút lại để tiếp tục tập lệnh.
Khi nghiện, tôi mở các tệp được sắp xếp lại (tôi thích đọc để kiểm tra xem tất cả) và khi tải lên Scribd với tập lệnh khác của tôi - scribd_up , vì vậy bây giờ tôi có thể xử lý rất nhiều tệp PDF rất hiệu quả.