Đổi tên tập tin PDF theo siêu dữ liệu?


Câu trả lời:


4

Nếu bạn cảm thấy thoải mái với python, bạn có thể sử dụng tập lệnh trên http://blog.matt-swain.com/post/25650072381/a-lightgra-xmp-parser-for-extracting-pdf-metadata-in . Tôi vừa thử nghiệm các kịch bản anh ấy cung cấp (để bắt đầu, bạn có thể pip install pdfminer) và chúng hoạt động độc đáo. Kết quả họ đưa ra là một cái gì đó dọc theo dòng:

[{'ModDate': "D:20050422142709+02'00'", 'CreationDate': "D:20050422142709+02'00'", 'Producer': 'Mac OS X 10.3.8 Quartz PDFContext', 'Creator': 'Word'}]

Đầu ra mà bạn có thể sử dụng để đổi tên các tập tin của mình.


1
Tôi thực sự đã giả định rằng cho đến nay bạn có nghĩa là siêu dữ liệu với nội dung (dựa trên liên kết của bạn). Ngoài ra còn có một công cụ tốt để phục hồi thông tin học tập có sẵn. Nó được gọi là pdfmeat .
don.joey

5

Điều này rất dễ dàng để đạt được với exiftool .

Chẳng hạn, lệnh sau sẽ đổi tên tất cả các tệp trong thư mục hiện tại thành <title>.extension:

exiftool '-filename<$title.%e' .

Bạn có thể cài đặt exiftool trên Ubuntu với:

sudo apt-get install libimage-exiftool-perl

Vui lòng tham khảo tài liệu chính thức để biết thêm thông tin:

http://www.sno.phy.queensu.ca/~phil/exiftool/filename.html


3

Có một sự thay thế khác. Bạn có thể sudo apt-get install pdftk. Với thư viện đó, bạn có thể chạy một lệnh giống như pdftk myfile.pdf dump_datakết quả trong một tập hợp infovalue:

InfoKey: Creator
InfoValue: Word
InfoKey: Producer
InfoValue: Mac OS X 10.3.8 Quartz PDFContext
InfoKey: ModDate
InfoValue: D:20050422142709+02'00'
InfoKey: CreationDate
InfoValue: D:20050422142709+02'00'
PdfID0: d7af25c8df737276d8d6b5de49d94d92
PdfID1: d7af25c8df737276d8d6b5de49d94d92
NumberOfPages: 58

Một lần nữa bạn có thể sử dụng thông tin đó trong một kịch bản đổi tên. Nếu cảm thấy cái sau là một cái gì đó tùy chỉnh tốt nhất bởi vì nó phụ thuộc vào việc bạn chỉ muốn tiêu đề, tác giả tiêu đề, hoặc cái gì khác.

Nguồn


0

Nếu bạn đang tìm kiếm một giải pháp vượt trội và các tệp PDF của bạn có bản chất học thuật, bạn có thể dùng thử Zotero , plugin Firefox.

Thật không may, điều này cần một vài bước để thực hiện, mỗi bước có thể hơi chậm nếu bạn đang cố gắng làm việc với nhiều tệp PDF cùng một lúc:

  1. Kéo và thả tệp PDF của bạn vào Zotero.
  2. Nhấp chuột phải vào chúng để lấy siêu dữ liệu (và tự động tải xuống thông tin thư mục).
  3. Nếu các tệp được nhận dạng chính xác, nhấp chuột phải vào chúng một lần nữa để tự động đổi tên.
  4. Xuất hoặc trực tiếp di chuyển các tập tin được đổi tên nơi bạn muốn chúng.

Câu trả lời cho một câu hỏi tương tự trên Superusers cho thấy cách làm điều tương tự bằng Mendeley . Trong Zotero, quá trình này có thể được tự động hóa hơn nữa bằng cách sử dụng Zotfile . Cuối cùng, đây là một danh sách đầy đủ các công cụ hữu ích tiềm năng dọc theo các dòng này.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.