Một tùy chọn khác là ScanTailor . Chương trình này đặc biệt phù hợp để xử lý nhiều lần quét cùng một lúc.
apt-get install scantailor
Thật không may, nó chỉ hoạt động trên các đầu vào tệp hình ảnh, nhưng nó đủ đơn giản để chuyển đổi một tệp PDF được quét thành jpg. Đây là một lớp lót mà tôi đã sử dụng để chuyển đổi toàn bộ thư mục PDF thành jpg. Nếu một tệp PDF có n trang, nó tạo ra n tệp jpg.
for f in ./*.pdf; do gs -q -dSAFER -dBATCH -dNOPAUSE -r300 -dGraphicsAlphaBits=4 -dTextAlphaBits=4 -sDEVICE=png16m "-sOutputFile=$f%02d.png" "$f" -c quit; done;
Tôi đã có ảnh chụp màn hình để chia sẻ, nhưng tôi không có đủ đại diện để đăng chúng.
ScanTailor xuất thành tif, vì vậy nếu bạn muốn các tệp trở lại dưới dạng PDF, bạn có thể sử dụng tệp này để tạo tệp PDF cho mỗi trang.
for f in ./*.tif; do tiff2pdf "$f" -o "$f".pdf -p letter -F; done;
Sau đó, bạn có thể sử dụng một lớp lót này hoặc một ứng dụng như PDFShuffler để hợp nhất bất kỳ hoặc tất cả các tệp thành một tệp PDF.
gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=output.pdf *.pdf