Trích xuất hình ảnh trong PDF mà không ảnh hưởng đến độ phân giải?


26

Vấn đề của tôi là tôi có nhiệm vụ trích xuất hình ảnh từ tệp PDF 640 trang.

Phần lớn trong số đó là biểu đồ và bảng với văn bản. Làm một bản sao đơn giản và dán làm cho hình ảnh mất độ phân giải và các văn bản trở nên mờ và đôi khi không thể đọc được.

Bạn có biết cách tốt hơn để trích xuất hình ảnh từ tệp PDF mà không ảnh hưởng đến độ phân giải không?


2
Tôi đã giải quyết vấn đề này bằng cách cài đặt KDE cho windows và sau đó cài đặt okular .. Trong Okular, người ta có thể chọn hình ảnh và lưu thẳng vào tập tin loại bỏ quá trình dán nó vào một chương trình chỉnh sửa hình ảnh mà tôi nghĩ bằng cách nào đó giữ được độ phân giải.
r2b2

Xem câu trả lời Photoshop bên dưới và làm theo bước 4.
George Langley

Câu trả lời:


23

Từ bộ XPDF (là Phần mềm nguồn mở & miễn phí), bạn có thể sử dụngpdfimages.execông cụ CLI để trích xuất tất cả hình ảnh từ PDF hoặc chỉ tất cả hình ảnh từ một loạt các trang. Dưới đây là một ví dụ để trích xuất tất cả các hình ảnh từ các trang 33-36:

pdfimages.exe ^
  -f 33 ^
  -l 36 ^
  -j ^
   c:/path/to/input.pdf ^
   c:/path/to/directory/input_images

Các -jsẽ cố gắng trích xuất hình ảnh JPEG nhúng như JPEG. Tất cả các hình ảnh khác là đầu ra dưới dạng PPM (pixmap di động). Chú ý, PPM hoàn toàn không bị nén!


Hoạt động tuyệt vời trên Mac là tốt! Tôi đã sử dụng lệnh đầu cuối./pdfimages -j PDF_to_be_extracted.pdf /Users/username/output_folder/
Eptin

4

điều này rất dễ sử dụng evince(Trình xem tài liệu) trong Ubuntu. Chỉ cần mở pdf bằng cách sử dụng evincesau đó tối đa hóa cửa sổ, đánh dấu nó Always on topsau đó kéo và thả hình ảnh vào thư mục bạn thích.


Evince cũng có sẵn cho Windows và BSD . Nhấp chuột phải vào hình ảnh cung cấp để Lưu dưới dạng .
Adobe

1

Trích xuất hình ảnh độ phân giải gốc là một trong những tính năng miễn phí của Solid Framework SDK, vì vậy nếu bạn tạo giải pháp của mình trong C #, thì đây là: http://www.soliddocument.com/features.htmlm?product=SolidFramework

Ứng dụng mẫu minh họa tính năng này cũng miễn phí nếu bạn cần một giải pháp lô GUI: http : //www.pdf-iternals.com/doad.htmlm?product=SolidPDFMechanic

(Tôi có Tài liệu vững chắc)


1

(1) Bạn có thể mở tệp trong Word 2013 (chỉ cần sử dụng Tệp - Mở), nơi bạn có thể sao chép hình ảnh. Độ phân giải đủ tốt để in, nhưng không chắc chắn nếu giống như bản gốc.

(2) Trình xem phần mềm miễn phí SumatraPDF (rất tốt nếu bạn sử dụng LaTeX) có tùy chọn menu "Sao chép hình ảnh" khi bạn nhấp chuột phải vào hình ảnh. Tôi nghĩ rằng nó duy trì độ phân giải (mặc dù tôi thấy các tệp mà tôi không thể sao chép hình ảnh).

(3) Adobe Acrobat X , trong Tệp, có Lưu dưới dạng Khác - Hình ảnh và theo mặc định, nó sử dụng độ phân giải cao (trong trường hợp tôi đã thử, đó là độ phân giải gốc).

(4) Trong Perl , có nhiều hơn một cách, ví dụ, đọc ở đây và đặc biệt đề cập đến chương trình trích xuất hình ảnh JPEG từ bất cứ thứ gì , hoạt động hoàn hảo với tôi và chắc chắn trích xuất hình ảnh JPEG có độ phân giải gốc.


1

HÌNH ẢNH! Mở tệp PDF trong Photoshop. (Sử dụng Photoshop CC trên Windows 7)

  1. Khởi chạy Photoshop.
  2. Chọn Tệp / Mở (hoặc Lệnh / Điều khiển-O). Hộp thoại "Mở" sẽ bật lên.
  3. Chọn tệp PDF và nhấp OK / Enter. Hộp thoại "Nhập PDF" sẽ bật lên.
  4. QUAN TRỌNG - trong "Chọn", nhấp vào nút radio "Hình ảnh". Tất cả các hình ảnh sẽ xuất hiện!
  5. Chọn hình ảnh bạn muốn và nhấn OK.
  6. Ta-da!

0

Không - sao chép và dán sẽ giữ lại độ phân giải ban đầu của tài nguyên được nhúng - điều có thể xảy ra nhất là hình ảnh có độ phân giải thấp được thu nhỏ bên trong PDF, vì vậy khi xuất ra, nó trông tệ hơn.

Hãy thử thu nhỏ nó và / hoặc làm cho nó có cùng kích thước như trong PDF và nó thực sự phải giống nhau.

Ngoài ra, (và tùy chọn tệ nhất) chuyển sang thu phóng 100% và chụp ảnh màn hình hoặc sử dụng công cụ cắt trong Windows Vista / Windows 7.

LƯU Ý - Hình ảnh trong .PDFs thường được thu nhỏ / nén tại thời điểm chúng được chuyển đổi thành a .PDF, tuy nhiên, sau khi được nén, bạn sẽ có thể trích xuất với chất lượng tương đương PDF, không tệ hơn.


Điều này đặc biệt đúng với bảng. Có lẽ tôi cần phóng to độ phân giải mong muốn hoặc cho đến khi văn bản có thể đọc được và lấy ảnh chụp nhanh. Một tùy chọn khác tôi có là mở pdf trong Gimp và làm cho độ phân giải cao hơn
r2b2

Không phải những gì tôi thấy. Có một hình ảnh độ phân giải cao trong PDF, nhưng Acrobat (Pro DC cho Windows) lấy mẫu lại ngay lập tức với bất kỳ độ phóng đại nào bạn đang xem - tôi có thể tăng tới 600% trên PDF hiện tại Tôi đang làm việc trước khi tôi thấy bất kỳ pixel. Nhưng việc chọn và sao chép nó, ở bất kỳ độ phóng đại nào, chỉ có phiên bản lo-res của nó chỉ hoạt động ở mức 100%.
George Langley

0

Bạn đang sử dụng phần mềm xem PDF nào?

Bằng cách sử dụng chương trình chỉnh sửa / tạo PDF , như Adobe Acrobat Pro , bạn sẽ có thể trích xuất các hình ảnh được nhúng như trong tệp PDF *. Bạn có thể dùng thử miễn phí từ trang Adobe (cho Windows và Mac), mà bạn có thể sử dụng chỉ cho mục đích.

* miễn là chúng không được bảo vệ, trong trường hợp đó bạn sẽ phải .. er, tôi sẽ không đến đó ...


Bản dùng thử miễn phí Adobe Acrobat của nó. Tôi cũng sẽ thử điều này, cảm ơn!
r2b2

1
@ r2b2: Ồ, nếu bạn đã sử dụng Adobe Acrobat Standard, tôi không nghĩ sử dụng phiên bản Pro sẽ giúp ích.
paradroid

0

Bạn có thể sử dụng Imagemagick để chuyển đổi tất cả các trang PDF thành các tệp hình ảnh riêng biệt (mặc dù tôi không chắc sẽ mất bao lâu để làm một tài liệu lớn như vậy, hoặc nếu nó sẽ đối phó!) Và sau đó cắt bỏ những gì bạn muốn. Có thể đáng để thực hiện chạy thử với điều này vì ít nhất bạn sẽ tìm hiểu xem độ phân giải của hình ảnh nhúng có ổn với những gì bạn cần không.


0

Cách tốt nhất là sử dụng Adobe Acrobat Pro (phiên bản 2010 hoặc mới hơn). Chuyển đến Tệp -> Lưu dưới dạng -> Tùy chọn khác -> Đóng gói PostScript và sau đó nhấp vào Lưu.


0

Nếu bạn có Acrobat pro thì đây là cách đơn giản nhất để chụp ảnh có độ phân giải cao (đặt mức độ bạn muốn). Trong tùy chọn / kiểm tra chung, hộp ' sử dụng độ phân giải cố định cho công cụ chụp nhanh ' và đặt độ phân giải theo ý thích của bạn, ví dụ: 300ppi hoặc thậm chí cao hơn. Sau đó chụp ảnh nhanh (công cụ / chọn & thu phóng / công cụ chụp nhanh) và nó sẽ sao chép một bản sao độ phân giải cao vào khay nhớ tạm của bạn. Sau đó dán nó từ clipboard của bạn, nơi bạn muốn. làm việc tuyệt vời

Để xem mô tả chi tiết hơn, nhấp vào liên kết này ...

câu trả lời chi tiết của ai đó với ảnh chụp màn hình


0

Tôi thường trích xuất hình ảnh bằng cách mở các tệp pdf trong Adobe Illustrator, sau đó sao chép và dán chúng vào InDesign. Độ phân giải bảo tồn.


0

Adobe Acrobat Pro

Tệp> SaveAs sẽ sử dụng cài đặt Chuyển đổi từ PDF trong "Chỉnh sửa> Tùy chọn"

[Chuyển đổi từ PDF] sẽ cho phép [Chỉnh sửa cài đặt ...] cho từng định dạng tệp

Tốt nhất sẽ phụ thuộc vào hình ảnh nguồn và độ phân giải đã được sử dụng để tạo PDF.

Nhưng bạn có thể nhận được kết quả khá tốt bằng cách Chỉnh sửa cài đặt TIFF không mất dữ liệu

Đặt Độ phân giải thành 1200 trở lên (nếu Lưu thất bại đặt ở mức thấp hơn), sau đó sử dụng Tệp gốc> SaveAs để hiển thị tệp PDF thành các tệp riêng lẻ có độ phân giải cao

Không phải là cách tốt nhất, nhưng thực sự tốt hơn nhiều so với kết xuất dưới dạng một loại tài liệu khác.

Các tập tin sẽ rất lớn, nhưng phù hợp hơn để cắt và dán


0

Trên máy Mac, bạn có thể xuất hình ảnh hoặc toàn bộ trang từ Xem trước và nhận độ phân giải đầy đủ. Bạn sẽ được hỏi độ phân giải bạn muốn trong một hộp thoại.


0

Trong Adobe InDesign, bạn có thể sử dụng lệnh 'Place' để nhập tệp PDF. Nếu bạn muốn nhập các trang cụ thể, hãy bật hộp kiểm Hiển thị tùy chọn nhập trong hộp thoại xuất hiện sau khi bạn nhấp vào lệnh Place. Kéo và thay đổi kích thước khung hình để những gì bạn cần là hình ảnh độ phân giải cao phù hợp với trang. Bạn cần thay đổi kích thước kích thước trang tài liệu theo tỷ lệ khung hình của hình ảnh. Khi bạn hài lòng với những gì bạn thấy, hãy sử dụng lệnh Xuất và chọn PDF chất lượng cao. Điều này sẽ tạo ra một tệp PDF có độ phân giải cao mà bạn có thể in hoặc sử dụng trong các tài liệu latex.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.