Nếu bạn muốn hợp nhất văn bản bị hỏng trong khi vẫn giữ được nhiều định dạng, vị trí, đoạn văn và kiểu chữ khác của văn bản hiện có, thay vì dán vào vùng văn bản mới được tạo dưới dạng văn bản thuần túy, bạn có thể thử John Wundes ' tuyệt vời Tham gia kịch bản khung văn bản .
Nó thực hiện chính xác những gì nó nói trên hộp thiếc: nó hợp nhất các đoạn văn bản thành một đoạn văn bản, bằng cách đưa ra các phán đoán thông minh dựa trên vị trí chúng có liên quan với nhau:
- Nó hợp nhất các đoạn văn bản điều chỉnh (ví dụ từ các dòng văn bản bị hỏng từ các tệp PDF) thành các dòng đơn, với một số điều khiển được cung cấp về mức độ gần như được coi là cùng một dòng.
- Nó hợp nhất các dòng văn bản riêng biệt thành một đối tượng văn bản nhiều dòng với văn bản theo đúng thứ tự (từ trên xuống dưới), sửa các đoạn bị hỏng.
- Sau đó, có một tùy chọn để khôi phục định dạng ban đầu của tất cả các văn bản được hợp nhất. Điều này có thể mất một chút thời gian, nhưng nó hữu ích cung cấp cho bạn các ước tính khá chính xác về thời gian cần thiết và tùy chọn bỏ qua nếu nó không xứng đáng.
Nó thật sự tốt!
Lưu ý rằng nó chỉ hoạt động trên văn bản điểm, không phải văn bản khu vực (tốt ở đây vì các tệp PDF hầu như luôn luôn là văn bản điểm). Nếu bạn đang cố gắng hợp nhất văn bản khu vực vì bất kỳ lý do gì, bạn có thể chuyển đổi nó với tập lệnh 'Tạo điểm văn bản' của Bản đồ Kelso
Nó cũng có ích sử dụng kết hợp với AjarProductions' Chuyển đổi Text Diện tích kịch bản (Kelso Bản đồ cũng có một kịch bản tương tự, nhìn thấy link ở trên), nếu bạn muốn bật gãy trở lại văn bản trong sang các lĩnh vực văn bản phù hợp với đoạn văn bản tự động chảy:
- Chọn đoạn văn bản bị hỏng, chạy tập lệnh Tham gia khung văn bản
- Sao chép và dán văn bản vào trình soạn thảo văn bản cho phép bạn tìm / thay thế các ký tự đoạn văn (ví dụ: InDesign, trình soạn thảo văn bản đơn giản của người viết mã hoặc thậm chí có thể là một cái gì đó như ( thì thầm ) Word ...)
Tìm / thay thế kết thúc ngắt dòng không mong muốn. Nếu có nhiều đoạn riêng biệt mà bạn muốn giữ lại, 1) bạn có chắc chắn sẽ không tốt hơn khi sử dụng InDesign không? 2) bạn có thể làm như thế này:
- Tìm / thay thế hai đánh dấu đoạn liên tiếp bằng một số trình giữ chỗ văn bản không xuất hiện ở bất kỳ nơi nào khác trong văn bản (ví dụ
\|\C.L.O.W.N.H.O.R.R.O.R/|/
)
- Tìm / thay thế các đánh dấu đoạn văn bằng không có gì hoặc dấu cách: biến nó thành một dòng văn bản dài với các cụm từ thỉnh thoảng
\|\C.L.O.W.N.H.O.R.R.O.R/|/
- Tìm / thay thế
\|\C.L.O.W.N.H.O.R.R.O.R/|/
cho một ký tự đoạn mới - nơi đặt một đoạn bất cứ nơi nào có hai đoạn trước.
Sao chép văn bản trở lại và chạy tập lệnh Convert to Text Area trên đó. Bây giờ là một khu vực văn bản trôi chảy với các đoạn ngắt ở đúng nơi.
Thật không may, không có gì có thể sửa văn bản được phác thảo ngoại trừ việc ngăn không cho nó được phác thảo, gõ lại hoặc tin tưởng vào phần mềm OCR có khả năng tinh ranh.