Làm cách nào để chuyển đổi tập tin pdf thành tập tin odt?


32

Tôi muốn chuyển đổi một .pdftập tin thành một .odttập tin để tôi có thể chuyển đổi nó thành một .doctập tin. Có phần mềm / script nào có thể làm điều này. Tôi đã cố gắng sao chép nội dung của .pdftệp và dán nó vào trình soạn thảo tự do định dạng không được bảo tồn.

Tài liệu được bảo mật vì vậy tôi không muốn sử dụng bất kỳ dịch vụ trực tuyến nào cho việc chuyển đổi.

Bất kỳ sự trợ giúp nào cũng được đánh giá cao.


Liên quan (nhưng không phải là bản sao!): Làm cách nào để chuyển đổi một odt sang pdf?
Eliah Kagan

1
Đối với các câu hỏi cụ thể về LIBREOFFICE / OpenOffice, tôi khuyên bạn nên hỏi.libreoffice.org
Bucic

Câu trả lời:


15

Tôi cũng cảm thấy khó chịu vì thiếu bộ chuyển đổi PDF sang ODT miễn phí. Tôi thậm chí không cần bất cứ điều gì phức tạp. Chỉ là một công cụ tạo các tệp ODT mà sau đó tôi có thể chú thích trong LibreOffice (ví dụ để điền vào các biểu mẫu).

Tôi biết cách thực hiện thủ công bằng cách chuyển đổi tài liệu PDF thành tệp đồ họa và sau đó nhập chúng vào LibreOffice, nhưng điều đó khá tẻ nhạt.

Vì vậy, cuối cùng tôi đã viết một kịch bản shell nhỏ nhanh chóng thực hiện tất cả các bước cần thiết. Bạn có thể tìm thấy nó tại https://github.com/gutschke/pdf2odt

Nó có thể lấy bất kỳ số lượng tệp PDF và hình ảnh nào làm đầu vào và tạo tệp ODT có thể mở và chỉnh sửa trong LibreOffice. Hình ảnh hiển thị dưới dạng nền trang, vì vậy bạn có thể viết lên chúng một cách tự do. Mỗi hình ảnh được liên kết với phong cách trang riêng của mình. Hãy ghi nhớ điều đó, khi chèn ngắt trang và điều chỉnh kiểu trang nếu cần.

Tôi đã thử nghiệm tập lệnh trên cả Linux và Mac. Vì nó chỉ cần một số ít các công cụ tiêu chuẩn hợp lý, nên nó khá dễ mang theo.


Kịch bản này tạo ảnh chụp màn hình của mỗi trang và vẽ chúng thành định dạng mục tiêu, Cảm ơn kịch bản Gutschke
Oliver

Tôi đã sử dụng pdf2oomột vài năm trước đây, nhưng dường như bây giờ nó tạo ra các tệp bị hỏng cho LibreOffice. Kịch bản này làm điều đó và nhiều hơn nữa - cảm ơn!
eacousineau

3
Thật không may, tập lệnh pdf2odt chuyển đổi sang định dạng hình ảnh được sử dụng làm nền ODT. Đừng mong đợi có thể "chỉnh sửa" bất kỳ văn bản gốc nào.
Richard Elkins

13

Bạn có thể xem PDF Utilities(poppler-utils thông qua Synaptic hoặc apt-get) bao gồm pdftotext :

Poppler là một thư viện kết xuất PDF dựa trên trình xem PDF Xpdf.

Gói này chứa các tiện ích dòng lệnh (dựa trên Poppler) để lấy thông tin của tài liệu PDF, chuyển đổi chúng sang các định dạng khác hoặc thao tác với chúng:
* pdfdetach - liệt kê hoặc trích xuất các tệp nhúng (tệp đính kèm)
* pdffonts - trình phân tích phông chữ
* pdfimages - trình trích xuất hình ảnh
* pdfinfo - thông tin tài liệu
* pdfseparate - công cụ trích xuất trang
* pdftocairo - Chuyển đổi PDF sang PNG / JPEG / PDF / PS / EPS / SVG bằng cách sử dụng Cairo
* pdftohtml - Trình chuyển đổi PDF sang HTML
* pdftoppm - PDF sang PPM / Công cụ chuyển đổi hình ảnh PNG / JPEG
* pdftops - Công cụ chuyển đổi PDF sang PostScript (PS)
* pdftotext - trích xuất văn bản
* pdfunite - công cụ hợp nhất tài liệu

Tất nhiên, thành công sẽ phụ thuộc vào cách tạo tệp pdf. Nếu bạn nhận được những gì bạn muốn dưới dạng tệp văn bản, thì bạn có thể lưu tệp đó dưới dạng tệp .odt.

Chỉnh sửa: Tôi quên cung cấp nguồn cho trích dẫn. Đó là từ tab mô tả trong Synaptic choPDF Utilities (based on Poppler).


3
Từ danh sách này, pdftohtmlphải phù hợp nhất cho nhiệm vụ, vì HTML có thể mang định dạng. Sau đó, HTML có thể được chuyển đổi thành ODT hoặc DOC.
imz - Ivan Zakharyaschev

10

LibreScript có khả năng nhập .pdftệp. Chỉ cần mở nó trong phiên bản hiện tại của LibreOffice để có kết quả tốt nhất. Tuy nhiên, nó sẽ mở tài liệu dưới dạng bản vẽ và bạn sẽ chỉ có thể chuyển đổi nó thành một trong các định dạng hình ảnh được hỗ trợ, không phải là tài liệu Nhà văn.

Đương nhiên, không phải tất cả các định dạng được bảo tồn, nhưng ít nhất là một số.


1
Tôi đã thử nó gần đây, và thật tệ, nó không lưu một định dạng dù chỉ một chút. Hơn nữa, nó làm cho văn bản không thể đọc được.
Hi-Angel

3

Nếu gói poppler-utils được cài đặt, tập lệnh Nautilus bên dưới (được đặt vào thư mục ~ / .gnome2 / nautilus-scripts dưới dạng tệp thực thi) sẽ giúp chuyển đổi tệp PDF sang HTML (tùy chọn "-i" có thể được xóa để bao gồm hình ảnh cũng vậy), sau đó có thể được mở bằng LibreOffice Writer và được lưu dưới dạng ODT mặc dù thành công của chuyển đổi định dạng phụ thuộc rất nhiều vào cách tạo PDF.

http://ubfoxone.com/6xI1afyu6QdQvgdCGn0kym


Cảm ơn bạn cho kịch bản hữu ích này. Chỉ là một nhận xét nhỏ (từ man pdftohtml): -noframes : generate no frames. Not supported in complex output mode.Vì vậy, -noframessẽ không có bất kỳ ảnh hưởng nào với -ctập hợp.
Glutimate

2
Cảm ơn, tôi đã loại bỏ tùy chọn dư thừa này khỏi tập lệnh của mình. Một kịch bản bash được cung cấp năng lượng để cung cấp một gui cho tất cả các tùy chọn này có vẻ rất hay ;-)
Sadi

#MHC, có vẻ như thông tin này là sai; nếu chúng tôi không bao gồm -noframes, chúng tôi sẽ nhận được các tệp html riêng cho các trang pdf; Vì vậy, tôi chèn nó một lần nữa vào kịch bản của tôi.
Sadi

Điều đó thật lạ. Phải là một sai lầm trong tài liệu sau đó. Tôi sẽ thay đổi bản sao của kịch bản cho phù hợp. Cảm ơn cho những người đứng đầu lên!
Glutimate

3

Hãy thử Calibre. Nó chuyển đổi thành html và sau đó thành các định dạng khác. Nó đã làm một công việc khá tốt trên một tệp lớn (183 trang) mà tôi sẽ phải in.

Trong trường hợp của tôi, tôi đã chuyển đổi nó thành epub, nhưng để giải trí, chỉ cần chuyển đổi nó thành .docx, điều này rất tốt.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.