Làm cách nào tôi có thể biến ảnh của tài liệu giấy thành tài liệu được quét?


44

Máy quét của tôi đã bị hỏng! Tôi có một máy ảnh tốt mặc dù vậy tôi đã chụp một vài bức ảnh về các tài liệu tôi muốn quét ... Tuy nhiên, chúng trông giống như những bức ảnh trên giấy chứ không phải các tài liệu được quét:

  • Hình ảnh không phẳng
  • Ánh sáng không đồng đều (bóng tối như các trang cong, v.v.)
  • Văn bản rõ ràng không được xử lý thành văn bản PDF có thể sao chép.

Chúng đơn giản là không phù hợp để sử dụng chuyên nghiệp, nhưng chúng gần gũi.

Tôi đang tìm kiếm một số thứ (hoặc phương pháp) có thể thực hiện bất kỳ hoặc tất cả những điều trên để tôi có thể chuyển từ một số tệp JPG sang một tệp PDF được chú thích [tùy chọn] của toàn bộ nội dung, đó là định dạng đúng (A4 thông thường).

Bất kỳ đề xuất (ngắn đi ra ngoài và mua một máy quét mới)?


1
Trên Android, ứng dụng Google Drive có thể xử lý một chút và giúp bạn có được tệp PDF cỡ A4 từ một bộ ảnh (tạo "quét" mới) - áp dụng B & W và một chút làm thẳng (cả trên ứng dụng, trong khi tạo) trên đó, và nó trông chủ yếu là quét (chất lượng thấp). OCR là một vấn đề khó khăn hơn.
muru

Không biết về bất kỳ phần mềm Ubuntu nào nhưng tôi đã loại bỏ máy quét của mình sau khi phát hiện ra rằng có những ứng dụng trên điện thoại di động chủ yếu làm điều tương tự. Bạn có thể muốn xem ứng dụng Genius Scan (cho Android) hoặc Scannable (cho iPhone). Sau đó áp dụng pdfjoinđể khâu chúng lại với nhau. Không có OCR mặc dù.
Jos

Lý do tôi muốn thực hiện điều này qua ảnh chứ không phải ứng dụng dành cho thiết bị di động là dSLR của tôi [nghĩa đen] tốt hơn khoảng một nghìn lần so với máy ảnh của tôi. Và nếu không có gì làm được điều này trong một cú đánh, tôi thực sự nghĩ rằng tôi có thể tự xử lý OCR. Có rất nhiều dự án nguồn mở làm một công việc đủ tốt.
Oli

Tôi có thể vừa hồi sinh máy quét của mình bằng băng dính, bánh mì nướng và mứt để khẩn cấp tắt nhưng tôi nghĩ đây vẫn là một vấn đề thú vị.
Oli

Oli , tôi googled một số ví dụ về Stackexchange như thế này tex.stackexchange.com/questions/94523/simulate-a-scanned-paper và điều này stackoverflow.com/questions/8955425/... chỉ không chắc chắn nếu tôi nhận ngay câu hỏi của bạn;)
JoKeR

Câu trả lời:


45

Có một số cách để làm điều đó. Mặc dù tất cả các cách có đường của tôi có một vấn đề, họ sẽ không thực sự làm phẳng hình ảnh của bạn. Một bức tranh tốt hơn hoặc ít hơn sẽ vẫn được yêu cầu.

Một cách dễ dàng là bạn dùng thử phần mềm ScanTailor

sudo apt-get install scantailor 

Bạn phải mất 6 bước để tối ưu hóa ảnh của mình. Ở bước cuối cùng, bạn có thể chọn tùy chọn "Cân bằng chiếu sáng", điều này sẽ mang lại cho bạn một cái nhìn sạch đẹp!


Cá nhân tôi thường chỉ sử dụng GIMP . Nhưng bạn cần một số kỹ năng cơ bản để đạt được mục tiêu của bạn.

sudo apt-get install gimp 
  1. cắt ảnh theo cách mong muốn
  2. sử dụng tùy chọn Colors-> Curvesđể thao tác đầu ra màu theo cách bạn muốn ...

Điều chỉnh Curves màu để có được đầu ra sạch đẹp.


Một chương trình nhỏ xinh khác là gscan2pdf , nơi bạn cũng có thể tải ảnh và xuất chúng dưới dạng PDF. Thậm chí còn có một liên kết đến GIMP để bạn có thể cải thiện ảnh với các bước được mô tả ở trên .

sudo apt-get install gscan2pdf 

1
Chưa bao giờ thấy ScanTailor trước đây. Nó dường như gần như hoàn hảo ngoại trừ việc tôi không thể tìm ra cách lưu nó như một thứ tôi muốn giữ (ví dụ PDF). Có ý kiến ​​gì không?
Oli

PS: chào mừng bạn đến hỏi Ubuntu và Stack Exchange!
Oli

1
@Oli đầu ra được lưu trong thư mục bạn chọn lúc đầu. Như tôi thấy ngay bây giờ nó lưu nó như là tiff. Vì vậy, bạn muốn chạy một convert file.tiff file.pdftrong giao diện điều khiển.
Wittich

2
Ồ vâng, xấu của tôi. Tôi đang sử dụng nhiều trang nên tôi sẽ chuyển đổi chúng thành png find -maxdepth 1 -name '*.tif' -exec convert {} {}.png \;và sau đó tham gia cùng với chúng pdfjoin --outfile output.pdf --a4paper --rotateoversize false *.png. Chỉ nghĩ lớn tiếng khi tôi quên cách làm tất cả những điều này :) Cảm ơn một lần nữa.
Oli

2
ScanTailor là một khám phá !!! Tôi thường sẽ làm tất cả những thứ này trong Gimp hoặc ứng dụng độc quyền như gimp, nhưng thợ may quét chỉ có các tính năng tôi cần để chuyển đổi hình ảnh của mình thành hình ảnh giống như quét, loại bỏ tất cả nhiễu :) Dễ dàng hơn nhiều so với tất cả các đường cong tôi từng sử dụng di chuyển trong Gimp. Cảm ơn rât nhiều !!!
Kostyantyn

20

Để tạo một bản sao có thể in hoặc PDF từ ảnh máy ảnh của tài liệu, chúng tôi phải chuyển đổi thủ công khá nhiều để đạt được một hình ảnh tương tự như anh ta xuất ra từ máy quét. Hầu hết các chuyển đổi này có thể được thực hiện với Gimp.

  1. Cố gắng làm cho tốt nhất bạn có thể hình ảnh nguồn gốc :

    • Chọn đèn sáng để giảm nhiễu pixel, nhưng để tránh phản xạ, chảy máu hoặc tán sắc ánh sáng không đồng đều, không sử dụng đèn flash trừ khi bạn có thiết bị flash studio.
    • Nếu có thể, hãy chọn nguồn sáng từ ít nhất hai bên (trên cùng bên phải hoặc bên trái)
    • Chụp ảnh từ khoảng cách lớn hơn bằng ống kính tele thay vì ống kính góc rộng.
    • Sử dụng chân máy để tránh rung lắc.
    • Hướng máy ảnh trực giao vào bề mặt của nguồn.
    • Bao gồm một số không gian giáp với nguồn ban đầu.
  2. Xem xét giải thích cho thang độ xám để có độ tương phản và loại bỏ các tạo phẩm pixel màu tốt hơn.

    nhập mô tả hình ảnh ở đây

  3. Điều chỉnh độ sáng và độ tương phản để làm cho nền màu xám có lẽ là màu trắng và các chữ màu đen tối đen.

    • Điều này có thể nhanh chóng được thực hiện với công cụ Gimp Colors> Levels nơi chúng ta có thể kéo điểm đen (trái) và điểm trắng (phải) hoặc chọn các điểm đen / trắng bằng công cụ chọn màu.

    nhập mô tả hình ảnh ở đây

    • Bóng trên các góc bị uốn cong có thể không bị xóa mà không xóa các phần của văn bản (xem 6.)
  4. Loại bỏ méo đệm?

    Tùy thuộc vào chất lượng ống kính ảnh của chúng tôi và mức thu phóng mà chúng tôi đã sử dụng, chúng tôi có thể có một số tạo tác đệm dẫn đến uốn cong viền ngoài của tài liệu. Có các plugin cũng loại bỏ các tạo phẩm này nhưng chúng tôi có thể thấy nhanh hơn khi chọn mức thu phóng của máy ảnh của chúng tôi, nơi chúng chỉ ở mức tối thiểu. Sau khi cắt (5.) chúng tôi thậm chí có thể không nhận thấy chúng nữa. Vì vậy, loại bỏ các tạo tác đệm chỉ có thể cần thiết trong trường hợp hình ảnh nguồn của chúng ta có nhiều đường thẳng ở các phần bên ngoài.

  5. Xoaycắt hoặc phối cảnh biến đổi hình ảnh nếu cần.

    Không giống như máy quét, máy ảnh của chúng tôi có thể không lấy nguồn song song với viền hình ảnh. Công cụ Gimp Rotate hoặc Phối cảnh sẽ cung cấp cho chúng tôi phản hồi trực quan để có thể xoay hoặc điều chỉnh phối cảnh của hình ảnh cho đến khi các dòng văn bản song song với trang.

    nhập mô tả hình ảnh ở đây
    Công cụ phối cảnh ở phía bên phải

Bây giờ chúng ta có thể chọn nguồn tài liệu bằng công cụ chọn hình chữ nhật để cắt hình ảnh bên trong tài liệu.

  1. Loại bỏ các bóng không mong muốn khỏi các vật phẩm uốn cong, nếp gấp hoặc họa tiết từ ống kính máy ảnh.

    • Những bóng này rất khó để loại bỏ và không có plugin hoặc bộ lọc tự động để giúp chúng tôi.
    • Về lý thuyết, chúng ta có thể phủ một lớp tô màu cho các vùng này nhưng nó có thể không dẫn đến kết quả như mong đợi, do đó có thể không xứng đáng với thời gian chúng ta cần.
    • Do đó, phương pháp nhanh nhất là chỉ cần sử dụng công cụ xóa để loại bỏ tất cả những bóng xấu xí đó bên ngoài văn bản (mà chúng ta nên dành).

      nhập mô tả hình ảnh ở đây đã xóa -> nhập mô tả hình ảnh ở đây

  2. Tỷ lệ hình ảnh?

    Tùy thuộc vào độ phân giải của camera, việc tăng kích thước hình ảnh lên kích thước hình ảnh của máy quét sẽ chỉ tăng kích thước tệp nhưng sẽ không có lợi ích gì đối với chất lượng hình ảnh. Thu nhỏ sẽ loại bỏ chi tiết. Do đó, chúng ta không nên chia tỷ lệ hình ảnh mà điều chỉnh kích thước in từ hộp thoại máy in (hoặc bên dưới trong 8.).

  3. Tạo PDF

    Chúng tôi có thể nhập hình ảnh được khôi phục thủ công ngay bây giờ của mình vào LibreScript ( Chèn> Phương tiện ) để

    • Xác định kích thước của nó
    • Xuất dưới dạng PDF
    • In (đối với tôi, việc in từ LibreOffice dẫn đến một kết quả mong muốn thường xuyên hơn bất kỳ điều gì khác).

Cảm ơn bạn rất nhiều cho các bước chi tiết. Họ đã giúp tôi giải quyết một vấn đề lâu dài là chuyển đổi ảnh thành tài liệu được quét. Tôi hoàn toàn ấn tượng bởi sức mạnh của sự chuyển đổi quan điểm.
Chethan S.

Câu trả lời tuyệt vời! Công cụ phối cảnh ban đầu khá khó hiểu với tôi, vì vậy đây là một hướng dẫn tuyệt vời. Tôi đã thêm 4 dòng hướng dẫn sau đó sử dụng các góc của hình ảnh xung quanh bằng cách sử dụng công cụ phối cảnh cho đến khi hình ảnh vuông với tất cả 4 hướng dẫn.
Gabriel Staples

(24 giờ sau). Úi! Tôi quên liên kết. Đây là hướng dẫn mà tôi đang nói đến: lifewire.com/ .
Gabriel Staples

1

Nếu bạn đã có hình ảnh của tài liệu, chỉ cần tải ứng dụng CamScanner về điện thoại / máy tính bảng của bạn. Nó sẽ cho phép bạn nhập hình ảnh, sau đó sẽ thực hiện cắt xén được đề xuất và cho phép bạn làm phẳng cũng như điều chỉnh màu sắc / độ tương phản, v.v. Chỉ mất một phút.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.