sao chép một bảng từ pdf như một bảng?


6

Làm cách nào tôi có thể sao chép hoặc xuất bảng từ tài liệu PDF sang Word, Excel, OneNote, v.v. dưới dạng bảng thay vì văn bản thuần túy?

Ví dụ pdf: ftp://ftp2.cits.rncan.gc.ca/pub/canvec/doc/CanVec_transition_guide_en.pdf , bắt đầu từ trang 9. Tôi đang sử dụng Office 2003, bản dùng thử OneNote 2007.


Làm thế nào để bạn sử dụng tiện ích mở rộng nhập PDF để sao chép bảng? Tôi có thể mở tài liệu PDF, nhưng tôi không thể chọn bảng để sao chép nội dung của nó, tôi chỉ có thể chọn một ô mỗi lần.
Sam Skuce

Cập nhật: "câu trả lời tích hợp" trước đó đã bị xóa. Câu hỏi này có trước sự hiểu biết của tôi về cách mọi thứ hoạt động tốt nhất trong cộng đồng Stack Exchange.
matt wilkie

Câu trả lời:


4

Bạn có thể thử Tabula - hoạt động khá tốt đối với nội dung hướng dữ liệu được đặt trong bảng.

Một đoạn giới thiệu ngắn có thể được tìm thấy trên trang chủ.

Sử dụng công cụ cho PDF được đính kèm với câu hỏi này, bạn phải:

  1. Tải tập tin vào đĩa cục bộ của bạn.
  2. Cài đặt và khởi động công cụ theo hướng dẫn trên trang chủ.
  3. Tải lên bản PDF và chọn Gửi .
  4. Điều hướng đến bảng đầu tiên và chọn bảng. Đảm bảo rằng bạn không chọn tiêu đề và chân trang của trang để có kết quả chính xác hơn. Tabula - lựa chọn bảng
  5. Chọn Lặp lại lựa chọn này nếu bạn cũng muốn chọn các bảng sau bằng cách sử dụng cùng tọa độ.
  6. Chọn Tải xuống tất cả dữ liệu và bạn nhận được. Tabula - Trích xuất dữ liệu bảng
  7. Chọn Tải xuống dữ liệu để nhận tệp CSV với các bảng được trích xuất. Tệp này có thể được mở bằng MS Excel hoặc bất kỳ ứng dụng nào khác có thể đọc định dạng CSV để xử lý thêm.

1
Bạn có thể thêm một số ảnh chụp màn hình hoặc giải thích từng bước về cách thực hiện việc này bằng phần mềm bạn đề xuất không?
MaQleod

Cảm ơn. Hoạt động tốt, nhưng không phát hiện chính xác các ô của bảng có giá trị được gói trên nhiều dòng.
Sam

6

Bạn có thể sử dụng trình xem tài liệu Okular có sẵn trên Linux và Windows máng http://windows.kde.org/ trình cài đặt.

Nó có thể chọn văn bản dưới dạng bảng, nơi bạn có thể xác định các hàng và cột.


5

MirzaD, cảm ơn vì đã gợi ý Okular. Tôi đã cài đặt nó trong máy tính để bàn Ubuntu của mình và chưa bao giờ xem nó một cách nghiêm túc .. cho đến bây giờ. Cảm ơn bạn.

Okular is awesometrong các tính năng mà nó đóng gói, và chắc chắn có thể giải quyết nhu cầu của anh chàng đặt câu hỏi. Với Okular, bạn sử dụng a Table Selection Toolvà xác định một khu vực, sau đó bấm vào viền cột để đánh dấu các trường .. và sau đó sao chép. Khi bạn dán nó, bạn sẽ nhận được một đầu ra được phân định bằng tab nhất quán rằng mọi công cụ nghiêm trọng đều có thể được xử lý dưới dạng tệp CSV.

Tôi có nhu cầu này (để trích xuất một vài bảng từ tài liệu PDF) ngay bây giờ trên máy tính để bàn Centos chạy gnome / xfce và cài đặt okular có nghĩa là cài đặt toàn bộ các công cụ đồ họa KDE khác. Vì vậy, tôi sẽ thử đầu tiên với tabula (trông cũng rất hứa hẹn), và nếu thất bại, thì okular nó sẽ phải như vậy.

Điều này sẽ làm việc cho các cửa sổ? Có, KDE có thể được cài đặt trong windows, nhưng các ứng dụng KDE đi kèm với một số chi phí khá lớn của các phần mềm không cần thiết khác .. Vì vậy, nó phụ thuộc vào nhu cầu của bạn tuyệt vời như thế nào, đây có thể là một lựa chọn khả thi cho ngay cả các cửa sổ.

Đọc thêm về Okular ở đây .. và khẩu hiệu của họ More Than a Readerchắc chắn phù hợp .. Tôi thực sự ấn tượng với những gì Okular có thể làm .. trong một ứng dụng gọn gàng và đủ nhanh với một dấu chân nhỏ.

Dự án KDE Windows .. giúp bạn dễ dàng cài đặt một tập hợp con các ứng dụng KDE tuyệt vời trong windows.


+1 cho liên kết đúng ( okular.kde.org ).
Rodrigo

2

Mở tài liệu bằng Adobe Acrobat. Bấm vào Tệp> Lưu dưới dạng. Chọn "HTML 4.01 với CSS 1.0 (* .htm, * .html)" trong "Lưu dưới dạng", sau đó lưu.

Sau đó, bạn có thể mở tệp HTML đã lưu trong Microsoft Word và tệp này sẽ được hiển thị dưới dạng bảng thay vì văn bản thuần túy.


1
Đây là một câu trả lời tốt cho những người đã mua Acrobat. Bất kỳ đề nghị cho những người không có nó? Lưu dưới dạng loại khác không có sẵn trong Adobe Reader.
matt wilkie

1
Đối với các lựa chọn thay thế miễn phí, OpenOffice sẽ hiển thị bảng khi mở tài liệu PDF?
Arseni Mourzenko

2

www.freepdftoword.org - dịch vụ trực tuyến miễn phí. Có một công việc đáng tin cậy để tạo các đối tượng bảng thực sự trong Word.


Cảm ơn. Nó hoạt động hoàn hảo khi sử dụng các tùy chọn mặc định và không gặp vấn đề về hàng bổ sung của trình chuyển đổi trực tuyến thành công khác.
matt wilkie

1

Đây là một trong những khó khăn. Nếu bạn có phương tiện, giải pháp đơn giản nhất là liên hệ với người đã tạo ra PDF. Có thể họ đã làm nó từ một tệp .doc. Nếu bạn có thể lấy bản gốc, bạn có những gì bạn cần mà không cần chuyển đổi.


+1. Nhân tiện, sao chép nội dung từ tài liệu PDF (và chỉnh sửa nó?) Có thể không được phép nếu tài liệu đó có bản quyền. Vì vậy, liên hệ với tác giả rõ ràng là giải pháp tốt nhất.
Arseni Mourzenko

1

Một Q & A liên quan đã được, rõ ràng, xóa: https://stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800 (xem phiên bản cache: http://webcache.googleusercontent.com/ tìm kiếm q = cache:? 9I328EN_d64J: stackoverflow.com/questions/488089/extracting-tables-from-pdf-files-programmatically/857800+&cd=1&hl=en&ct=clnk&gl=ch ).

Bên dưới câu trả lời của tôi, xác nhận lại rằng Okular là một lựa chọn tuyệt vời cho một hành động loại bỏ nhanh chóng.

Để (các) trích xuất bảng nhanh (đơn -?), Rất đáng để kiểm tra Công cụ chọn bảng tuyệt vời của Okular.

  1. Mở tệp PDF và xác định vị trí bảng được đề cập
  2. kích hoạt Công cụ chọn bảng với Ctrl+5
  3. vẽ một khu vực hình chữ nhật để bao quanh bảng
  4. cuối cùng và nếu được yêu cầu, hãy xác định các phân chia dọcngang của các ô của bảng bằng cách nhấp vào các cạnh (bạn có thể cần chơi một chút để có ý tưởng - xem ảnh chụp màn hình bên dưới).

Một lựa chọn sử dụng Công cụ chọn bảng của Okular

Voila! Sao chép và dán, ví dụ, trong một bảng tính trống.


0

Tôi không thích thêm phần mềm bổ sung hoặc gửi dữ liệu ngoại vi của mình đến một trang bên ngoài để chuyển đổi nó. Thông thường vì khía cạnh thời gian!

Nhưng trong PDF, bạn có thể chọn dữ liệu trong các cột bằng cách giữ phím Alt và kéo, miễn là bảng của bạn không lớn (tức là bạn sẽ phải làm điều đó cho mỗi cột). Chỉ cần sao chép và dán từng từ.

Không lý tưởng, nhưng nó hoạt động mà không phải cài đặt thêm bất cứ điều gì!


Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.