Bạn có thể sử dụng pdftk
cho việc này. Thông tin thêm: Cách xuất và nhập dấu trang PDF .
Xuất dấu PDF trên dòng lệnh như thế này:
pdftk C:\Users\Sid\Desktop\doc.pdf dump_data output C:\Users\Sid\Desktop\doc_data.txt
Nhập dấu trang PDF từ một tệp dữ liệu như thế này:
pdftk C:\Users\Sid\Desktop\doc.pdf update_info C:\Users\Sid\Desktop\doc_data.txt output C:\Users\Sid\Desktop\updated.pdf
pdftk
định dạng dấu trang là một chút tẻ nhạt để viết. Thay vào đó tôi tạo ra kịch bản của riêng tôi sử dụng bash
, sed
, pdftk
và python3
. Hãy xem thử tại repo này: https://github.com/SiddharthPant/booky
Vì vậy, bây giờ tôi có thể tạo một tệp văn bản ( bkmrks.txt
) như thế này chỉ mất 5 phút để viết ngay cả đối với bản pdf 1000 trang.
{
Title1, 1
Title2, 2
{
Subtitle1, 3
Subtitle2, 4
{
SubSubtitle1, 5
...
}
}
}
và sau đó sử dụng kịch bản của tôi
./booky.sh pdf_file.pdf bkmrks.txt
điều này tự động tạo ra một pdf ( pdf_file_new.pdf
) có dấu trang của tôi trong đó.
Điều này sẽ hoạt động trong các hệ thống * nix nếu thay vào đó bạn đang ở trên máy Windows. Sau đó, trước tiên cài đặt python3
và pdftk
chỉ cần sử dụng booky.py
tệp trong repo để chuyển đổi bkmrks.txt
sang pdftk
định dạng tương thích
python3 booky.py < bkmrks.txt > output.txt
và sau đó sử dụng lệnh xuất để tạo tệp dữ liệu bị đổ. Xóa các dấu trang trước đó khỏi tệp đó và chèn nội dung output.txt
thay vào đó bằng cách sử dụng một bản sao dán đơn giản. Và sau đó nhập dữ liệu đó trở lại.