Làm cách nào để chỉnh sửa văn bản trong .jpeg được quét?


14

Tôi cần tải lên hình ảnh được quét dưới dạng tài liệu PDF.

Sau khi quét tài liệu, tôi có một .jpegvăn bản nhỏ mà tôi muốn chỉnh sửa trước khi chuyển đổi sang PDF để tải lên.

Tôi chưa bao giờ làm điều này trước đây vì vậy tôi thực sự bị mắc kẹt. Tôi có thể làm cái này như thế nào?


3
Sử dụng GIMP để xóa văn bản không mong muốn, giờ đây nó là một Hình ảnh chỉ cần che nó bằng một hình chữ nhật màu trắng.
Uri Herrera

Tôi chỉ không muốn xóa nó mà tôi muốn thay thế nó chỉ bằng hai từ
Mysterio

Đặt một hình chữ nhật màu trắng trên những gì bạn không muốn và sau đó đặt văn bản bằng công cụ văn bản.
Uri Herrera

1
@Murrio nó có thể đợi 9 giờ không? Nếu có, gửi email cho tôi tài liệu và tôi sẽ làm nó, thật dễ dàng. Nếu không, hãy xem câu trả lời OCR dưới đây & chúc may mắn.
Tom Brossman

3
NẾU điều này liên quan đến một hội đồng tuyển sinh, liệu có khôn ngoan khi chỉnh sửa văn bản và cố gắng làm cho nó xuất hiện xác thực? Tùy thuộc vào tình huống này có thể là bất hợp pháp.
Phục hồi Monica - -

Câu trả lời:


27

Để làm cho văn bản .jpegcó thể chỉnh sửa, bạn cần phần mềm Nhận dạng ký tự quang học (OCR). Tôi sử dụng ocrfeeder.

sudo apt-get install ocrfeeder

Để mở tệp hình ảnh, nhấp vào dấu 'cộng' (+).
nhập mô tả hình ảnh ở đây Sau khi bạn đã mở hình ảnh, nhấp vào biểu tượng tiếp theo bên phải để chạy OCR.
nhập mô tả hình ảnh ở đây
Sau khi hoàn thành OCR'ing hình ảnh, bạn có thể chọn văn bản bạn muốn ở bên trái và sao chép nó ra bên phải.
nhập mô tả hình ảnh ở đây

Cách dễ nhất để lấy văn bản ra là chỉ cần sao chép nó sang LibreOffice. Với một chút chỉnh sửa, bản sao của tôi trông rất giống nhau.

nhập mô tả hình ảnh ở đây

Sau khi bạn thực hiện các thay đổi bắt buộc, bạn có thể xuất chúng .pdfbằng cách nhấp vào 'xuất dưới dạng pdf' từ toobar LibreScript. nhập mô tả hình ảnh ở đây

Cuối cùng, tốt nhất để quét .pdfnếu bạn có thể. Nếu bạn không thể làm việc này rất tốt.

LƯU Ý: OCR không chính xác 100%, bạn có thể phải sửa lỗi và tài liệu của bạn càng có nhiều định dạng thì càng khó.


3
+1, Điều này chắc chắn mang lại kết quả tốt nhất. Các phương pháp khác liên quan đến thao tác với hình ảnh JPEG có thể trông khá tệ nếu văn bản bị bí danh, OCR tránh được vấn đề này.
Tom Brossman

@TimWolla Tùy thuộc vào JPG là đồ họa hoặc văn bản. Khi tôi đọc câu hỏi, JPG là một hình ảnh với một số văn bản.
philshem

11

Bạn không thể chỉnh sửa văn bản trong JPG, nhưng bạn xóa văn bản và thêm văn bản mới.

Đối với hình ảnh, hãy thử gimp (mã nguồn mở thay thế cho Photoshop). Mở hình ảnh bằng gimp, sau đó sử dụng công cụ xóa để xóa văn bản cũ. Sau đó sử dụng công cụ văn bản để thêm văn bản mới.

Hoặc, sử dụng inkscape , một chương trình đồ họa vector (tương tự Adobe Illustrator). Tạo một tệp SVG mới và dán vào JPG của bạn. Sau đó, che văn bản cũ bằng một hộp văn bản mới.

Tôi sẽ bắt đầu với gimp nhưng đối với hình ảnh của bạn có lẽ inkscape hoạt động tốt hơn. Bạn có thể cài đặt mã từ trung tâm phần mềm hoặc sử dụng các dòng này trong thiết bị đầu cuối

sudo apt-get install gimp

sudo apt-get install inkscape

7

Chúng tôi cũng có thể chỉnh sửa văn bản trên đầu một hình ảnh với Libre Office từ đó chúng tôi cũng có thể dễ dàng xuất các tệp này dưới dạng PDF.

  • Mở tài liệu của bạn để chèn hình ảnh với Insert -> Picture -> From File ... .

    nhập mô tả hình ảnh ở đây

  • Sau đó chọn "Gói -> Trong nền" từ menu ngữ cảnh nhấp chuột phải vào ảnh bạn vừa chèn.

  • Viết bất kỳ văn bản nào phía trên hình ảnh (nhưng chúng ta sẽ phải đặt nó với dòng mới, và khoảng trắng hoặc tabstops). Bất kỳ văn bản có sẵn cần phải được ghi đè. Trong ví dụ dưới đây, tôi đã thực hiện điều này bằng cách chọn nền đen và màu phông chữ trắng.

    nhập mô tả hình ảnh ở đây

  • Cuối cùng, chúng ta có thể thực hiện "Tệp -> Xuất dưới dạng PDF ..." .


0

Bạn không thể chỉnh sửa trực tiếp văn bản trong một tập tin hình ảnh. Bạn có thể chỉnh sửa tệp hình ảnh bằng cách sử dụng một chương trình như gimpvà đặt văn bản mới lên trên cũ nhưng đó là nó. Lấy làm tiếc.


Tìm kiếm phần mềm OCR . Bạn đã hiểu nhầm câu hỏi.
Lucio

0

Đôi khi tôi không muốn in ra một trang và chuyển đổi nó. Sau đó, tôi sử dụng kịch bản nhỏ này:

Làm cách nào để có thể trích xuất tức thời văn bản từ một vùng màn hình bằng các công cụ OCR?

Đó là cách nhanh nhất để chuyển đổi hình ảnh thành văn bản cho tôi và nó hoạt động gần như rất tốt.

Vì vậy, đề nghị của tôi là, bạn quét tài liệu và mở hình ảnh. Đồng thời, bạn mở một trình soạn thảo và sao chép các phần bạn cần vào trình chỉnh sửa. Với Easystroke bạn thực hiện một cử chỉ cho kịch bản, nó thực sự dễ dàng và nhanh chóng.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.