Xuất: Sao chép văn bản từ pdf mà không ngắt dòng


12

Có một số PDF ngoài tự nhiên nơi mọi dòng văn bản dường như được mã hóa cứng nên khi tôi sao chép một khối văn bản, mọi thứ đều đi kèm với nó: Ngắt dòng và dấu phân cách "-".

Câu hỏi của tôi là: Làm cách nào để tạo PDF trong InDesign khi hành vi này không xảy ra.

Có ai biết thêm về điều này?


2
Tôi chỉ muốn nhận xét rằng đây là một vấn đề lớn trong rất nhiều bài báo học thuật và tôi đã không tìm thấy lý do / giải pháp nào cho vấn đề này. Hy vọng cho câu trả lời tốt!
benteh

... Vì vậy, nó có thể là một số chức năng xuất khẩu cổ xưa trong một số thực hành ngu ngốc từ thời kỳ tiền định nghĩa là đáng trách.
benteh

Câu trả lời:


3

Đó là bởi vì PDF có thể được tạo theo nhiều cách từ một số phần mềm và ứng dụng trực tuyến. Mỗi trong số này xử lý các dòng văn bản khác nhau, vì vậy bạn không bao giờ có thể biết văn bản thực sự được bao quanh như thế nào cho đến khi bạn cố gắng sao chép dán từ PDF trở lại InDesign.

Tuy nhiên , PDF xuất trong InDesign thường sẽ giữ khoảng trắng ở cuối mỗi dòng để bạn không phải lo lắng về việc trả lại đoạn được chèn sau mỗi dòng. Để chắc chắn 100%, hãy Create Tagged PDFchọn hộp kiểm khi bạn xuất PDF từ InDesign. Cá nhân tôi sẽ luôn kiểm tra hộp này và đưa nó vào bất kỳ cài đặt trước nào tôi đang sử dụng. Thêm chi tiết về tùy chọn này ở đây .

Nếu bạn chạy vào một tệp PDF xuất khẩu kém và cần dọn sạch các đoạn trả về đoạn sau mỗi dòng văn bản, tùy chọn nhanh nhất là Tìm / Thay thế. Nhập ^pvào Find whattrường và đặt một khoảng trống trong Change totrường. Chọn một trong hai Storyhoặc Selectionbên dưới tùy thuộc vào tình huống của bạn và điều này sẽ làm sạch văn bản của bạn.

tìm hộp thoại thay đổi


2

Một cách hiệu quả là xuất PDF dưới dạng HTML từ Acrobat Pro , mở tệp đó trong trình duyệt web của bạn và sau đó sao chép văn bản từ đó.

Không giống như xuất dưới dạng văn bản, html thường không ngắt dòng.

Theo hiểu biết của tôi, bạn không thể ngăn điều này khỏi InDesign, đây dường như là một hành vi xuất phát từ phần mềm PDF hoặc PDF. Có thể là bất kỳ phần mềm xuất bản nào sử dụng "khung / hộp văn bản" sẽ tạo ra loại văn bản đó trong PDF.


-2

Đó là bởi vì đây là cách pdf nhận ra văn bản - mỗi dòng thực sự trở thành một đoạn (do đó trả về ở cuối của nó). Không có cách nào, bạn phải thay đổi nó trên toàn cầu trong các tài liệu, sau khi sao chép, sử dụng tùy chọn Tìm / Thay thế và các ký tự ẩn.


1
Nhưng có những người pdf không có hành vi này. PDF là nơi bạn có thể sao chép toàn bộ mọi thứ mà không gặp rắc rối. Tôi chỉ tự hỏi làm thế nào điều này có thể đạt được trong xuất khẩu.
KSPR
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.