Làm cách nào tôi có thể trích xuất một phạm vi trang / một phần của PDF?


423

Bạn có biết làm thế nào để trích xuất một phần của tài liệu PDF và lưu nó dưới dạng PDF không? Trên OS X, nó hoàn toàn không đáng kể bằng cách sử dụng Preview. Tôi đã thử trình soạn thảo PDF và các chương trình khác nhưng không có kết quả.

Tôi muốn một chương trình nơi tôi chọn phần mà tôi muốn và sau đó lưu nó dưới dạng pdf bằng một lệnh đơn giản như CMD+ Ntrên OS X. Tôi muốn phần được trích xuất được lưu ở định dạng PDF chứ không phải jpeg, v.v.


Bạn đã thử ImageMagick chưa?
Martin Schröder

3
Đó là cho bitmap Tôi cần một cái gì đó lưu dưới dạng PDF!
dùng72469

3
pdfshufflertrong repos.
Marc

2
pdfshufflerkhông hoạt động nữa trong Ubuntu 14.04+. Bạn luôn có thể sử dụng hộp thoại in hoặc thiết bị đầu cuối thay thế nhưpdfseparate
Rho

@Rho Phiên bản được cài đặt trực tiếp qua apt-getvẫn hoạt động tốt với tôi trong 16.04. Có lẽ họ đã sửa các lỗi, nếu có một số?
xji

Câu trả lời:


476

pdftklà một công cụ đa nền tảng hữu ích cho công việc ( trang chủ pdftk ).

pdftk full-pdf.pdf cat 12-15 output outfile_p12-15.pdf

bạn chuyển tên tệp của pdf chính, sau đó bạn bảo nó chỉ bao gồm một số trang nhất định (12-15 trong ví dụ này) và xuất nó sang một tệp mới.


6
Nếu tôi muốn trích xuất các trang 1-10, 15 và 17, làm cách nào để viết lệnh?
Patrick Li

31
@PatrickLipdftk A=in.pdf cat A1-10 A15 A17 output out.pdf
m8mble

9
Lưu ý rằng pdftkkhông có sẵn trong Ubuntu 18.04. (xem Askubfox.com/questions/1028522/áng )
alkamid

6
@alkamid đó là: sudo snap cài đặt pdftk
Qubix

12
Mặc dù pdftkchắc chắn là một công cụ có thể thực hiện công việc, tôi sẽ khuyên bạn nên chống lại nó. Đây không phải là phần mềm miễn phí, mà là một phần mềm sắc bén. Ngoài ra, nó cần JVM. Một công cụ hợp lý hơn là qpdf, như được đề xuất trong một câu trả lời khác .
leftaroundabout

246

Rất đơn giản, sử dụng trình đọc PDF mặc định:

in dưới dạng tập tin. chính là nó menu in

sau đó

thiết lập PDF mới


12
flippin rực rỡ
andybleaden 22/12/14

17
Tạo ra kết quả thảm khốc với các tệp chùm, bản đồ và bất kỳ tài liệu nào khác không phù hợp với định dạng trang máy in.
Luís de Sousa

11
Điều này có thể dẫn đến tệp có kích thước lớn hơn nhiều so với tài liệu gốc.
dat

7
vì vậy nó không "trích xuất" phạm vi trang. Nó tạo ra một pdf mới từ cái cũ, như thể bạn đã sử dụng cặp máy in / máy quét độ nét cao.
sylvainulg

6
Tốt cho các trường hợp đơn giản, nhưng kết quả không mong muốn trong các tài liệu có chú thích nổi bật: phần tô sáng trở nên mờ đục 100% và chặn văn bản.
yêu.by.Jesus

79

Phạm vi trang - tập lệnh Nautilus


Tổng quan

Tôi đã tạo một tập lệnh nâng cao hơn một chút dựa trên hướng dẫn @ThiagoPonte được liên kết đến. Các tính năng chính của nó là

  • Đó là GUI dựa trên,
  • tương thích với khoảng trắng trong tên tệp,
  • và dựa trên ba phụ trợ khác nhau có khả năng bảo toàn tất cả các thuộc tính của tệp gốc

Ảnh chụp màn hình

nhập mô tả hình ảnh ở đây

#!/bin/bash
#
# TITLE:        PDFextract
#
# AUTHOR:       (c) 2013-2015 Glutanimate (https://github.com/Glutanimate)
#
# VERSION:      0.2
#
# LICENSE:      GNU GPL v3 (http://www.gnu.org/licenses/gpl.html)
# 
# OVERVIEW:     PDFextract is a simple PDF extraction script based on Ghostscript/qpdf/cpdf.
#               It provides a simple way to extract a page range from a PDF document and is meant
#               to be used as a file manager script/addon (e.g. Nautilus script).
#
# FEATURES:     - simple GUI based on YAD, an advanced Zenity fork.
#               - preserves _all_ attributes of your original PDF file and does not compress 
#                 embedded images further than they are.      
#               - can choose from three different backends: ghostscript, qpdf, cpdf
#
# DEPENDENCIES: ghostscript/qpdf/cpdf poppler-utils yad libnotify-bin
#                         
#               You need to install at least one of the three backends supported by this script.
#
#               - ghostscript, qpdf, poppler-utils, and libnotify-bin are available via 
#                 the standard Ubuntu repositories
#               - cpdf is a commercial CLI PDF toolkit that is free for personal use.
#                 It can be downloaded here: https://github.com/coherentgraphics/cpdf-binaries
#               - yad can be installed from the webupd8 PPA with the following command:
#                 sudo add-apt-repository ppa:webupd8team/y-ppa-manager && apt-get update && apt-get install yad
#
# NOTES:        Here is a quick comparison of the advantages and disadvantages of each backend:
#
#                               speed     metadata preservation     content preservation        license
#               ghostscript:     --               ++                         ++               open-source
#               cpdf:             -               ++                         ++               proprietary
#               qpdf:            ++                +                         ++               open-source
#
#               Results might vary depending on the document and the version of the tool in question.
#
# INSTALLATION: https://askubuntu.com/a/236415
#
# This script was inspired by Kurt Pfeifle's PDF extraction script 
# (http://www.linuxjournal.com/content/tech-tip-extract-pages-pdf)
#
# Originally posted on askubuntu
# (https://askubuntu.com/a/282453)

# Variables

DOCUMENT="$1"
BACKENDSELECTION="^qpdf!ghostscript!cpdf"

# Functions

check_input(){
  if [[ -z "$1" ]]; then
    notify "Error: No input file selected."
    exit 1
  elif [[ ! "$(file -ib "$1")" == *application/pdf* ]]; then
    notify "Error: Not a valid PDF file."
    exit 1
  fi
}

check_deps () {
  for i in "$@"; do
    type "$i" > /dev/null 2>&1 
    if [[ "$?" != "0" ]]; then
      MissingDeps+="$i"
    fi
  done
}

ghostscriptextract(){
  gs -dFirstPage="$STARTPAGE "-dLastPage="$STOPPAGE" -sOutputFile="$OUTFILE" -dSAFER -dNOPAUSE -dBATCH -dPDFSETTING=/default -sDEVICE=pdfwrite -dCompressFonts=true -c \
  ".setpdfwrite << /EncodeColorImages true /DownsampleMonoImages false /SubsetFonts true /ASCII85EncodePages false /DefaultRenderingIntent /Default /ColorConversionStrategy \
  /LeaveColorUnchanged /MonoImageDownsampleThreshold 1.5 /ColorACSImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /GrayACSImageDict \
  << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /PreserveOverprintSettings false /MonoImageResolution 300 /MonoImageFilter /FlateEncode \
  /GrayImageResolution 300 /LockDistillerParams false /EncodeGrayImages true /MaxSubsetPCT 100 /GrayImageDict << /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor \
  0.4 /Blend 1 >> /ColorImageFilter /FlateEncode /EmbedAllFonts true /UCRandBGInfo /Remove /AutoRotatePages /PageByPage /ColorImageResolution 300 /ColorImageDict << \
  /VSamples [ 1 1 1 1 ] /HSamples [ 1 1 1 1 ] /QFactor 0.4 /Blend 1 >> /CompatibilityLevel 1.7 /EncodeMonoImages true /GrayImageDownsampleThreshold 1.5 \
  /AutoFilterGrayImages false /GrayImageFilter /FlateEncode /DownsampleGrayImages false /AutoFilterColorImages false /DownsampleColorImages false /CompressPages true \
  /ColorImageDownsampleThreshold 1.5 /PreserveHalftoneInfo false >> setdistillerparams" -f "$DOCUMENT"
}

cpdfextract(){
  cpdf "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -o "$OUTFILE"
}

qpdfextract(){
  qpdf --linearize "$DOCUMENT" --pages "$DOCUMENT" "$STARTPAGE-$STOPPAGE" -- "$OUTFILE"
  echo "$OUTFILE"
  return 0 # even benign qpdf warnings produce error codes, so we suppress them
}

notify(){
  echo "$1"
  notify-send -i application-pdf "PDFextract" "$1"
}

dialog_warning(){
  echo "$1"
  yad --center --image dialog-warning \
  --title "PDFExtract Warning" \
  --text "$1" \
  --button="Try again:0" \
  --button="Exit:1"

  [[ "$?" != "0" ]] && exit 0
}

dialog_settings(){
  PAGECOUNT=$(pdfinfo "$DOCUMENT" | grep Pages | sed 's/[^0-9]*//') #determine page count

  SETTINGS=($(\
      yad --form --width 300 --center \
          --window-icon application-pdf --image application-pdf \
          --separator=" " --title="PDFextract"\
          --text "Please choose the page range and backend"\
          --field="Start:NUM" 1[!1..$PAGECOUNT[!1]] --field="End:NUM" $PAGECOUNT[!1..$PAGECOUNT[!1]] \
          --field="Backend":CB "$BACKENDSELECTION" \
          --button="gtk-ok:0" --button="gtk-cancel:1"\
      ))

  SETTINGSRET="$?"

  [[ "$SETTINGSRET" != "0" ]] && exit 1

  STARTPAGE=$(printf %.0f ${SETTINGS[0]}) #round numbers and store array in variables
  STOPPAGE=$(printf %.0f ${SETTINGS[1]})
  BACKEND="${SETTINGS[2]}"
  EXTRACTOR="${BACKEND}extract"

  check_deps "$BACKEND"

  if [[ -n "$MissingDeps" ]]; then
    dialog_warning "Error, missing dependency: $MissingDeps"
    unset MissingDeps
    dialog_settings
    return
  fi

  if [[ "$STARTPAGE" -gt "$STOPPAGE" ]]; then 
    dialog_warning "<b>   Start page higher than stop page.   </b>"
    dialog_settings
    return
  fi

  OUTFILE="${DOCUMENT%.pdf} (p${STARTPAGE}-p${STOPPAGE}).pdf"
}

extract_pages(){
  $EXTRACTOR
  EXTRACTORRET="$?"
  if [[ "$EXTRACTORRET" = "0" ]]; then
    notify "Pages $STARTPAGE to $STOPPAGE succesfully extracted."
  else
    notify "There has been an error. Please check the CLI output."
  fi
}


# Main

check_input "$1"
dialog_settings
extract_pages

Cài đặt

Vui lòng làm theo các hướng dẫn cài đặt chung cho các tập lệnh Nautilus . Hãy chắc chắn đọc tiêu đề kịch bản một cách cẩn thận vì nó sẽ giúp làm rõ việc cài đặt và sử dụng tập lệnh.


Trang một phần - PDF Shuffler


Tổng quan

PDF-Shuffler là một ứng dụng python-gtk nhỏ, giúp người dùng hợp nhất hoặc phân tách các tài liệu pdf và xoay, cắt và sắp xếp lại các trang của họ bằng giao diện đồ họa tương tác và trực quan. Nó là một lối vào cho python-pyPdf.

Cài đặt

sudo apt-get install pdfshuffler

Sử dụng

PDF-Shuffler có thể cắt và xóa các trang PDF đơn. Bạn có thể sử dụng nó để trích xuất một phạm vi trang từ tài liệu hoặc thậm chí một phần trang bằng chức năng cắt xén:

nhập mô tả hình ảnh ở đây


Phần tử trang - Inkscape


Tổng quan

Inkscape là một trình soạn thảo đồ họa vector nguồn mở rất mạnh mẽ. Nó hỗ trợ một loạt các định dạng khác nhau, bao gồm các tệp PDF. Bạn có thể sử dụng nó để trích xuất, sửa đổi và lưu các thành phần trang từ tệp PDF.

Cài đặt

sudo apt-get install inkscape

Sử dụng

1.) Mở tệp PDF bạn chọn bằng Inkscape. Một hộp thoại nhập sẽ xuất hiện. Chọn trang bạn muốn trích xuất các yếu tố từ. Để lại các cài đặt khác như chúng là:

nhập mô tả hình ảnh ở đây

2.) Trong Inkscape, nhấp và kéo để chọn (các) thành phần bạn muốn trích xuất:

nhập mô tả hình ảnh ở đây

3.) Đảo ngược lựa chọn với !và xóa đối tượng đã chọn bằng DELETE:

nhập mô tả hình ảnh ở đây

4.) Cắt tài liệu cho các đối tượng còn lại bằng cách truy cập hộp thoại Thuộc tính tài liệu bằng CTRL+ SHIFT+ Dvà chọn "khớp tài liệu với hình ảnh":

nhập mô tả hình ảnh ở đây

5.) Lưu tài liệu dưới dạng tệp PDF từ hộp thoại Tệp -> Lưu dưới dạng :

6.) Nếu có hình ảnh bitmap / raster trong tài liệu bị cắt của bạn, bạn có thể đặt DPI của chúng trong hộp thoại xuất hiện tiếp theo:

nhập mô tả hình ảnh ở đây

7.) Nếu bạn làm theo tất cả các bước, bạn sẽ tạo ra một tệp PDF thực sự chỉ bao gồm các đối tượng bạn chọn:

nhập mô tả hình ảnh ở đây


Nỗ lực lớn lao. Cảm ơn! Tôi hiểu rằng nó không cho phép chọn một phần của trang, mà chỉ toàn bộ trang. Tôi có đúng không
Carnendil

2
@carnendil: Vâng, chính xác. Tôi không nghĩ ghostscript có khả năng đó. Nhưng có thể có những giải pháp khác để thực hiện việc này theo chương trình . Hiện tại tôi đã chỉnh sửa câu trả lời của mình bằng một giải pháp thay thế (và một chút hackish) bằng cách sử dụng PDF-shuffler.
Glutimate

3
ok, tôi đã thêm một phương pháp khác bằng Inkscape.
Glutimate

1
pdfshufflerlà không đủ nếu bạn muốn trích xuất một phần của trang PDF. Dữ liệu PDF gốc của trang vẫn được lưu giữ trong tệp. Không sử dụng phương pháp này nếu bạn muốn xóa dữ liệu nhạy cảm khỏi tệp PDF.
Rob W

pdfshufflerbây giờ được gọi là pdfarranger.
Amoe

69

QPDF là tuyệt vời. Sử dụng theo cách này để trích xuất các trang 1-10 input.pdfvà lưu nó dưới dạng output.pdf.

qpdf --pages input.pdf 1-10 -- input.pdf output.pdf

Xin lưu ý rằng input.pdfđược viết hai lần.

Bạn có thể cài đặt nó bằng cách gọi:

sudo apt-get install qpdf

Nó là một công cụ tuyệt vời để thao tác PDF, rất nhanh, có rất ít phụ thuộc. "Nó có thể mã hóa và tuyến tính hóa các tệp, hiển thị các phần bên trong của tệp PDF và thực hiện nhiều thao tác khác hữu ích cho người dùng cuối và nhà phát triển PDF."

http://sourceforge.net/projects/qpdf/


3
Vấn đề duy nhất tôi gặp phải với điều này là vẫn liệt kê tất cả các trang trong mục lục, mặc dù hầu hết đã bị xóa. Ngoài ra, cảm ơn tuyệt vời! :)
Wilf

3
Phần mềm tuyệt vời. Nice
Anwar

2
Cảnh báo - Các tệp đều rất lớn..about cùng kích thước với bản gốc.
Corey Alix

3
Hoạt động, nhưng cú pháp để chỉ định các trang (liệt kê tệp đầu vào hai lần, sau đó thêm --) thực sự kỳ lạ.
Dan Dascalescu

3
Cờ --pages cho phép bạn ghép các trang từ nhiều tệp PDF. Lưu ý rằng bạn có thể tránh trùng lặp tên bằng cách sử dụng .thay cho tệp đầu vào trong tùy chọn --pages : qpdf --pages . 1-10 -- input.pdf output.pdf.
bart

43

Lưu tệp này dưới dạng tập lệnh shell, như pdfextractor.sh:

#!/bin/bash
# this function uses 3 arguments:
#     $1 is the first page of the range to extract
#     $2 is the last page of the range to extract
#     $3 is the input file
#     output file will be named "inputfile_pXX-pYY.pdf"
gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dSAFER \
   -dFirstPage="${1}" \
   -dLastPage="${2}" \
   -sOutputFile="${3%.pdf}_p${1}-p${2}.pdf" \
   "${3}"

Để chạy loại:

./pdfextractor.sh 4 20 myfile.pdf
  1. 4 đề cập đến trang nó sẽ bắt đầu pdf mới.

  2. 20 đề cập đến trang nó sẽ kết thúc pdf với.

  3. myfile.pdf là tập tin pdf mà bạn muốn giải nén.

Đầu ra sẽ nằm myfile_p4_p20.pdftrong cùng thư mục tệp pdf gốc.

Tất cả điều này và nhiều thông tin hơn ở đây: Tech Tip


15
Hãy giữ cho nó đơn giản:gs -sDEVICE=pdfwrite -dNOPAUSE -dBATCH -dFirstPage=1 -dLastPage=10 -sOutputFile=output.pdf input.pdf
Ho1

và làm cách nào để chỉ định tệp đầu vào?
Anwar

1
-1 để thực hiện mở rộng tham số bash bên ngoài chuỗi trích dẫn kép. (nên được "-sOutputFile=${3%.pdf}_p${1}-p${2}.pdf"vv (lưu ý các trích dẫn)).
Rotsor

1
@ Ho1 hãy viết nó như một câu trả lời mới, nó thực sự có ích!
Joshua Salazar

Đây là câu trả lời di động nhất, vì ghostscript có thể sẽ được cài đặt khá nhiều ở bất cứ đâu.
Calimo


27

Có một tiện ích dòng lệnh được gọi là pdfseparate .

Từ các tài liệu:

pdfseparate sample.pdf sample-%d.pdf

extracts  all pages from sample.pdf, if i.e. sample.pdf has 3 pages, it
   produces

sample-1.pdf, sample-2.pdf, sample-3.pdf

Hoặc, để chọn một trang duy nhất (trong trường hợp này là trang đầu tiên) từ tệp sample.pdf:

pdfseparate -f 1 -l 1 sample.pdf sample-1.pdf

2
công cụ tuyệt vời! nhanh hơn nhiều so vớipdftk
Anwar

3
Tốt, nhưng nó chỉ giới hạn trong một trang và nếu bạn muốn nhiều hơn thế, bạn sẽ nhận được các trang riêng biệt.
Ho1

2
Chắc chắn, mặc dù người ta có thể làm theo lệnh trên với pdfunite để tạo một tài liệu duy nhất.
jdmcbr

3
Nếu bạn có một tài liệu khổng lồ và cần chia tất cả các trang, nó thực sự nhanh chóng và hữu ích.
MEDVIS

19

pdftk( sudo apt-get install pdftk) là một dòng lệnh tuyệt vời quá cho thao tác PDF. Dưới đây là một số ví dụ về những gì pdftkcó thể làm:

   Collate scanned pages
     pdftk A=even.pdf B=odd.pdf shuffle A B output collated.pdf
     or if odd.pdf is in reverse order:
     pdftk A=even.pdf B=odd.pdf shuffle A Bend-1 output collated.pdf

   Join in1.pdf and in2.pdf into a new PDF, out1.pdf
     pdftk in1.pdf in2.pdf cat output out1.pdf
     or (using handles):
     pdftk A=in1.pdf B=in2.pdf cat A B output out1.pdf
     or (using wildcards):
     pdftk *.pdf cat output combined.pdf

   Remove page 13 from in1.pdf to create out1.pdf
     pdftk in.pdf cat 1-12 14-end output out1.pdf
     or:
     pdftk A=in1.pdf cat A1-12 A14-end output out1.pdf

   Burst a single PDF document into pages and dump its data to
   doc_data.txt
     pdftk in.pdf burst

   Rotate the first PDF page to 90 degrees clockwise
     pdftk in.pdf cat 1east 2-end output out.pdf

   Rotate an entire PDF document to 180 degrees
     pdftk in.pdf cat 1-endsouth output out.pdf

Trong trường hợp của bạn, tôi sẽ làm:

     pdftk A=input.pdf cat A<page_range> output output.pdf

Gói 'pdftk' không có ứng cử viên cài đặt
FireInTheSky

8

Bạn đã thử PDF Mod chưa?

Bạn có thể ví dụ .. giải nén các trang và lưu chúng dưới dạng pdf.

Sự miêu tả:

PDF Mod là một công cụ đơn giản để sửa đổi các tài liệu PDF. Nó có thể xoay, trích xuất, xóa
và sắp xếp lại các trang thông qua kéo và thả. Nhiều tài liệu có thể được kết hợp thông qua kéo
và thả. Bạn cũng có thể chỉnh sửa tiêu đề, chủ đề, tác giả và từ khóa của
tài liệu PDF bằng PDF Mod.

Cài đặt qua trung tâm phần mềm

Hy vọng điều này sẽ hữu ích.

Regar.


CÓ, tôi thực sự đã thử nó nhưng nó KHÔNG cho phép tôi lưu một phần của trang, ví dụ như một cốt truyện dưới dạng pdf ... Trừ khi tôi không thấy tùy chọn này. Nó cho phép tôi trích xuất toàn bộ một trang từ một tài liệu nhưng đó không phải là điều tôi muốn
user72469

Tôi sử dụng nó thường xuyên, công cụ tuyệt vời! nhưng tôi đã có một tài liệu với khoảng 170 trang mà pdfmod không thể xử lý.
yêu.by.Jesus

Ồ Điều này là đáng ngạc nhiên trơn tru. Đã ném cuốn sách thực 512 trang của tôi vào đó (50MiB) và nó ... đã được nhắc. UI là một làn gió. Đối với một người nghiện CLI như tôi, cần có một số mức GUI để thuyết phục tôi, nhưng điều này sẽ làm được!
sehe

PDF Mod có lỗi chạy trong Kubfox 18
Joshua Salazar

8

Tôi đã cố gắng làm như vậy. Tât cả nhưng điêu bạn phải lam la:

  1. cài đặt pdftk:

    sudo apt-get install pdftk
    
  2. nếu bạn muốn trích xuất các trang ngẫu nhiên:

    pdftk myoldfile.pdf cat 1 2 4 5 output mynewfile.pdf
    
  3. nếu bạn muốn trích xuất một phạm vi:

    pdftk myoldfile.pdf cat 1-2 4-5 output mynewfile.pdf
    

Vui lòng kiểm tra nguồn để biết thêm thông tin.


Tôi thấy câu trả lời này tốt nhất vì nó cho thấy cách bạn có thể nhập nhiều phạm vi.
Roman Luštrik

6

Hóa ra, tôi có thể làm điều đó với imagemagick. Nếu bạn không có nó, hãy cài đặt đơn giản với:

sudo apt-get install imagemagick

Lưu ý 1 : Tôi đã thử điều này với pdf một trang (Tôi đang học cách sử dụng imagemagick, vì vậy tôi không muốn gặp nhiều rắc rối hơn mức cần thiết). Tôi không biết nếu nó hoạt động như thế nào với nhiều trang, nhưng bạn có thể trích xuất một trang quan tâm với pdftk:

pdftk A=myfile.pdf cat A1 output page1.pdf

trong đó bạn chỉ ra số trang sẽ được tách ra (trong ví dụ trên, A1chọn trang đầu tiên).

Lưu ý 2 : Hình ảnh thu được bằng cách sử dụng quy trình này sẽ là một raster.


Mở pdf bằng lệnh display, là một phần của imagemagickbộ:

display file.pdf

Của tôi trông như thế này:

hiển thị hình ảnh của pdf
Click vào hình để xem phiên bản có độ phân giải đầy đủ

Bây giờ bạn bấm vào cửa sổ và một menu sẽ bật sang một bên. Ở đó, chọn Transform | Trồng trọt .

biến đổi hình ảnh> menu cắt

Quay lại cửa sổ chính, bạn có thể chọn khu vực bạn muốn cắt bằng cách kéo con trỏ (lựa chọn góc này sang góc khác).

lựa chọn diện tích để cắt
Chú ý con trỏ hình bàn tay xung quanh hình ảnh trong khi chọn

Lựa chọn này có thể được tinh chỉnh trước khi tiến hành bước tiếp theo.

Khi bạn đã hoàn tất, hãy chú ý đến hình chữ nhật nhỏ xuất hiện ở góc trên bên trái (xem hình trên). Nó hiển thị kích thước của khu vực được chọn đầu tiên (ví dụ 281x218) và thứ hai tọa độ của góc đầu tiên (ví dụ +256+215).

Viết các kích thước của khu vực được chọn; bạn sẽ cần nó tại thời điểm lưu hình ảnh bị cắt.

Bây giờ, quay lại menu pop (mà bây giờ là menu "crop" cụ thể), nhấp vào nút Cắt .

thực đơn cắt ảnh

Cuối cùng, một khi bạn hài lòng với kết quả cắt xén, nhấp vào menu File | Lưu lại

Điều hướng đến thư mục mà bạn muốn lưu pdf đã cắt, nhập tên, nhấp vào nút Định dạng , trên cửa sổ "Chọn loại định dạng hình ảnh" chọn PDF và nhấp vào nút Chọn . Quay lại cửa sổ "Duyệt và chọn tệp", nhấp vào nút Lưu .

hình ảnh lưu dưới dạng pdf

Trước khi lưu, imagemagicksẽ yêu cầu "chọn hình học trang". Tại đây, bạn nhập kích thước của hình ảnh đã cắt, sử dụng chữ cái đơn giản "x" để phân tách chiều rộng và chiều cao.

hình ảnh chọn hình trang

Bây giờ, bạn có thể thực hiện tất cả điều này một cách hoàn hảo từ dòng lệnh (lệnh convertcó tùy chọn -crop) - chắc chắn là nhanh hơn, nhưng bạn sẽ phải biết trước tọa độ của hình ảnh bạn muốn trích xuất. Kiểm tra man convertmột ví dụ trong trang web của họ .


Bạn không biết về GUI của fantemagick. Trông có vẻ thú vị. Tuy nhiên, vui lòng sửa lại cho tôi nếu tôi sai nhưng tôi nghĩ rằng hình ảnh không thể xử lý các hình ảnh véc tơ. Vì vậy, những gì bạn đang xuất có thể sẽ chỉ là hình ảnh raster / bitmap. Trong trường hợp đó, phương pháp này giống như chụp ảnh màn hình của một vùng của tài liệu.
Glutimate

1
Thật vậy, imagemagickhoạt động chỉ hình ảnh raster, và displaychỉ là một lệnh của bộ. Có rất nhiều giao diện cho imagemagick- kiểm tra trang web của họ. Đối với hình ảnh vector, giải pháp tốt nhất là, tôi nghĩ, phương pháp của bạn với Inkscape.
Carnendil

2
Bạn có thể muốn thêm từ chối trách nhiệm ở đầu câu trả lời một cách thận trọng rằng điều này sẽ chuyển đổi từ vector sang đồ họa raster. Khách sạn này làm cho nó một cách tiếp cận cơ bản khác nhau.
bluenote10

2

PDF Split and Merge khá hữu ích cho việc này và các hoạt động thao tác PDF khác.

Tải về từ đây


1
Bạn có thể tải xuống phiên bản mới nhất từ ​​liên kết ở trên, nhưng nếu bạn thích sự tiện lợi của Trung tâm phần mềm, bạn cũng có thể cài đặt phiên bản đó từ đó (hoặc từ thiết bị đầu cuối, thông qua sudo apt-get install pdfsam). Tuy nhiên, phiên bản trong Ubuntu khá lỗi thời, vì nó vẫn ở phiên bản 1.1.4 trong khi phiên bản sourceforge đã là 2.2.2.
Waldir Leoncio

3.x mới nhất (hiện tại là 3.1.0) có gói .deb có thể được cài đặt trên Ubuntu và có mô-đun Extract Pages thực hiện những gì OP yêu cầu
Andrea Vacondio

1
@Andrea Vacondio Bravo cho chỉnh sửa tuyệt vời của bạn! Bạn đang giúp làm cho internet an toàn. Tôi phát hiện ra rằng tập tin từ liên kết cũ tại sourceforge.net có crap được nhúng trong đó. Chủ sở hữu mới của trang web SourceForge cho biết họ sẽ ngừng làm việc này, nhưng rõ ràng họ đã nói dối.
karel

2

Vì người dùng ban đầu đã yêu cầu một công cụ tương tác chứ không phải công cụ dòng lệnh: Một giải pháp dễ dàng là sử dụng bất kỳ trình xem PDF nào (okular trên Kubfox, evince hoặc thậm chí Firefox trên Ubuntu) và sau đó chỉ cần sử dụng hộp thoại in tiêu chuẩn, chọn "in ra Tệp PDF ", rồi chọn trong hộp thoại cài đặt mở rộng, trang nào sẽ" in ". Biến thể này có một số nhược điểm, vì một số mánh lới quảng cáo trên PDF gốc (như các trang được xoay, biểu mẫu, v.v.) có thể bị mất, nhưng nó hoạt động đơn giản đối với hầu hết các tệp PDF đơn giản.


0

Nếu bạn muốn trích xuất từ ​​các tệp PDF của mình, bạn có thể sử dụng http://www.sumnotes.net . Đây là một công cụ tuyệt vời để trích xuất các ghi chú, nội dung nổi bật và hình ảnh từ các tệp PDF. Bạn cũng có thể xem hướng dẫn trên Youtube bằng cách gõ sumnotes.

Tôi hy vọng bạn sẽ thích nó!

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.