Cài đặt máy ảnh tốt nhất để chụp ảnh văn bản?


11

Tôi đang sử dụng S95 của mình để chụp ảnh tài liệu văn bản (cả giấy & microfilm) cho OCR. Tôi đã hỏi về các vấn đề làm thế nào để chụp ảnh màn hình máy tính tốt nhất cho microfilm, nhưng tôi đã suy nghĩ về cách tốt nhất để chụp ảnh văn bản để văn bản trở nên rõ ràng và sắc nét. Dưới đây là những suy nghĩ hiện tại của tôi, nhưng tôi muốn nghe những gì bất cứ ai có nhiều kinh nghiệm chụp ảnh hơn tôi phải nói:

  1. Tôi đang sử dụng số megapixel nhỏ hơn (khoảng 6-7MP thay vì tối đa của S95 là 10MP), để các tệp PDF kết quả không giết chết máy tính của tôi khi tôi thực sự cuộn qua chúng

  2. Khẩu độ - thấp hơn (ví dụ f / 6.3), để nếu máy ảnh không chính xác song song với trang, văn bản sẽ vẫn được lấy nét

  3. Tốc độ màn trập - Có một sự đánh đổi ở đây, vì các thư viện thường có ánh sáng yếu hơn, vì vậy tôi muốn giảm tốc độ màn trập tăng phơi sáng, nhưng không có chân máy, sẽ có cơ hội bị rung lắc máy ảnh

  4. ISO - Tôi không thực sự chắc chắn điều này sẽ ảnh hưởng đến nó như thế nào.

  5. Cân bằng trắng - Một lần nữa, không thực sự khá chắc chắn.

Tôi đã thử nghiệm các cài đặt khác nhau trên máy ảnh của mình, nhưng tôi chỉ tìm hiểu về nhiếp ảnh và muốn biết liệu có ai có bất kỳ đề xuất nào về cách chụp ảnh văn bản tốt nhất, từ sách hoặc từ tài liệu, dễ đọc không.


3
Tại sao không sử dụng đúng công cụ cho công việc và sử dụng máy quét?
ahockley

7
"Tại sao không sử dụng đúng công cụ cho công việc và sử dụng máy quét?" - Bởi vì nhiều tài liệu mà tôi làm việc cùng không thể quét được. Chúng rất dễ vỡ hoặc thư viện không cho phép bạn quét hoặc thư viện tính chi phí cắt cổ để quét lên tới $ 0,5 / trang.
Jason

2
Tôi muốn nói rằng: Tôi hy vọng rằng việc sử dụng của bạn là tôn trọng bản quyền một cách thích hợp, nếu và có liên quan. :) Giả sử như vậy, tôi hy vọng bạn tìm thấy câu trả lời của bạn!
lindes

3
"Tôi hy vọng rằng việc sử dụng của bạn là tôn trọng bản quyền một cách thích hợp" - Vâng, công việc của tôi là với các tài liệu bên ngoài các hạn chế bản quyền (Tôi là một nhà sử học, chủ yếu nghiên cứu về châu Âu cuối thế kỷ 19)
Jason

2
@ahockley: một lý do khác để không quét là mất nhiều thời gian. Với máy ảnh DSLR, tôi có thể thực hiện khoảng 20 trang mỗi phút trên mặt bàn, nhưng máy quét nhanh sử dụng bộ nạp tài liệu và chi phí rất cao.

Câu trả lời:


7

Nếu máy ảnh của bạn có chế độ đen trắng, tôi sẽ thử điều đó để giảm thời gian xử lý bài đăng của bạn. Ngoài ra, nhiều chương trình OCR tôi đã làm việc với B & W tốt hơn nhiều.

Bạn sẽ muốn có được song song với trang như bạn có thể, vì để giảm rung máy khi cầm tay, có lẽ bạn sẽ cần khẩu độ rộng nhất của mình để tối đa hóa tốc độ màn trập. Cảm biến nhỏ trên s95 của bạn sẽ tăng DOF đủ để tôi mở khẩu độ rộng nhất có thể.

Xem xét bạn sẽ thực hiện điều này thông qua OCR, tăng ISO của bạn lên bất cứ điều gì mang lại cho bạn mức phơi sáng thích hợp với độ rung tối thiểu. OCR ít có khả năng phàn nàn về tiếng ồn hơn so với các chữ cái mờ.

Cân bằng trắng, nếu bạn chỉ nói về văn bản, nên dành cho bất kỳ cài đặt "trong nhà" nào cho máy ảnh của bạn - nhưng thật lòng mà nói, đừng quá lo lắng về nó.

Số megapixel của bạn chỉ có thể quan trọng nếu văn bản tài liệu của bạn cực kỳ nhỏ và bạn sẽ cần giải quyết rõ ràng mức độ chi tiết đó, nhưng tôi đoán 6-7 sẽ ổn đối với hầu hết mọi thứ.


1
Bạn có thể có nghĩa là "vuông góc với trang". Nếu bạn song song sẽ khó đọc văn bản. ;-)
Craig Walker

@Craig Walker - anh ấy đã sử dụng thuật ngữ "song song" với trang và tôi hiểu ý anh ấy, vì vậy tôi đã không cố gắng làm anh ấy bối rối. Chưa kể cảm biến sẽ song song, cũng như khung ngắm. Nó chỉ phụ thuộc vào phần nào của máy ảnh mà bạn tham khảo. Thuật ngữ này là có chủ ý.
rfusca

Sử dụng nhiều megapixel nhất có thể, các tài liệu của OCR là những gì quan trọng và chúng sẽ tương đối nhỏ và miễn là nguồn đó là tất cả văn bản, dù sao cũng không bị ảnh hưởng bởi độ phân giải của camera. Tôi sử dụng Abbyy FineReader và nó hoạt động tốt hơn trên các hình ảnh có độ phân giải cao hơn (ví dụ 21MP thay vì 10MP). Vì vậy, chụp ở 10MP.

đủ công bằng.
Craig Walker

+1 cho chế độ B / W. RGB để xử lý văn bản đang lãng phí pixel.
Greg

2

Bạn dường như đã nắm bắt tốt các cài đặt. Rung máy sẽ làm hỏng khả năng đọc văn bản hơn bất kỳ thứ gì khác, vì vậy tôi sẽ tối ưu hóa điều đó trước. Nếu bạn không thể sử dụng chân máy, hãy đảm bảo tốc độ màn trập của bạn ít nhất là 1 so với tiêu cự của bạn (tương đương 35mm). Thu nhỏ sẽ làm điều này dễ dàng hơn. Sử dụng ổn định hình ảnh nếu bạn có nó.

Khẩu độ có thể được đặt khá rộng, chỉ cần đảm bảo rằng bạn song song với trang. Khẩu độ rộng sẽ giúp tốc độ màn trập, một lần nữa mờ do khẩu độ rộng không là gì so với mờ do chuyển động của máy ảnh!

ISO, bất cứ điều gì bạn cần để có được một tiếp xúc tốt. Tiếng ồn không ảnh hưởng đến khả năng đọc cho đến khi nó thực sự xấu.

Chụp cân bằng trắng tùy chỉnh dựa trên giấy sẽ tốt hơn, nhưng phần mềm OCR sẽ có thể đối phó với nền trắng.


1
  1. Tôi giả sử bạn đang chuyển đổi JPEG thành PDF. Tôi khuyên bạn nên chụp tối đa và sử dụng chương trình để giảm kích thước xuống 6-7 MP với độ sắc nét được áp dụng sau khi giảm kích thước và trước khi chuyển đổi sang PDF.

  2. Để làm rõ, bạn muốn khẩu độ hẹp hơn cho độ sâu trường rộng hơn, đó là số f-stop cao hơn. (ví dụ: bạn muốn f / 8 thay vì f / 2). Với văn bản để dễ đọc, hãy cố gắng đặt camera càng vuông góc càng tốt để bạn không cần lo lắng về độ sâu trường ảnh. Đó là một ý tưởng tốt để dừng lại một chút từ mở rộng để giảm quang sai như CA mà bạn sẽ thấy với màu đen trên văn bản màu trắng. Bạn càng ở gần tờ giấy, độ sâu trường ảnh sẽ càng nông.

  3. Điều này có thể sẽ có ảnh hưởng lớn nhất đến khả năng đọc nếu bạn đang nắm giữ. Nếu đang cầm, bạn muốn chọn tốc độ màn trập sao cho nhanh hơn 1 / (tiêu cự tương đương 35mm), hoặc thậm chí nhanh hơn. Điều này phụ thuộc vào cài đặt thu phóng bạn đang sử dụng trên P & S của bạn. Nếu bạn sử dụng đầu rộng, bạn có thể thoát khỏi tốc độ màn trập dài hơn, nhưng có thể bị méo thùng. Nếu bạn đang chụp ảnh tài liệu văn bản và không phải màn hình máy tính, tôi khuyên bạn nên thử flash.

    Nếu bạn có thể, hãy đẩy tài liệu lên (được nhấn hoặc một cái gì đó để nó phẳng) để bạn có thể đặt máy ảnh lên một cái gì đó và có được tốc độ màn trập như bạn muốn. Bạn cũng có thể sử dụng túi đậu hoặc các vật nhỏ để đặt góc máy ảnh khi nó nghỉ ngơi. Ngoài ra, bạn có thể nhận bộ điều hợp chân máy nước cho P & S.

  4. Khẩu độ, tốc độ màn trập và ISO tạo thành một tam giác phơi sáng. Đọc về nó ở đây . ISO càng cao, khẩu độ hẹp hơn và tốc độ màn trập ngắn hơn bạn có thể sử dụng, nhưng hình ảnh sẽ nhiễu hơn. Tôi khuyên dùng ISO thấp (400 hoặc ít hơn) cho P & S bằng văn bản.

  5. Chọn cân bằng trắng cho tình huống ánh sáng của bạn. Nếu bạn có đèn huỳnh quang, hãy sử dụng nó. Nếu bạn đang sử dụng đèn flash, hãy sử dụng đèn flash cân bằng trắng.


Tôi không nghĩ f / 8 là thực tế khi chụp trong nhà cầm tay (trừ khi sử dụng đèn flash, bạn sẽ cần xin phép thư viện trước) cộng với f / 8 sẽ gây mất tập trung với một cảm biến nhỏ, độ tăng độ sắc nét là tối thiểu so với mức tăng yêu cầu về thời gian màn trập / ISO.
Matt Grum

@Matt f / 8 là một ví dụ cho thấy anh ta muốn số cao hơn để tăng độ sâu trường ảnh (và giảm các quang sai khác như CA, có thể nhìn thấy được). Tôi đã không cho anh ta hướng dẫn vì tôi không chắc anh ta có bao nhiêu ánh sáng. Phân tâm? Ý bạn là nhiễu xạ?
Eruditass

Vâng, tôi có nghĩa là nhiễu xạ - Tôi đang viết điều này trên điện thoại của mình, có thói quen khó chịu là tự động đọc các từ của mình ngay cả khi tôi đánh vần chúng chính xác. CA sẽ không phải là một vấn đề lớn (so với rung máy), tôi nghĩ rằng tốt nhất bạn nên dừng lại từ nơi rộng mở, nếu ánh sáng là một vấn đề lớn ...
Matt Grum

Bạn không yêu công nghệ? Vâng, tôi muốn nói rằng một điểm dừng mở rộng là một hướng dẫn tốt và đồng ý rằng rung máy sẽ là mấu chốt.
Eruditass

Đó là một gợi ý thực sự tốt để chụp với MP tối đa, và sau đó lấy mẫu trên máy tính. Tôi có thể tưởng tượng rằng việc làm sắc nét + độ tương phản thêm sẽ dẫn đến văn bản sắc nét hơn nhiều, dễ đọc hơn.
Jason

1

Tôi đồng ý với các đề xuất để chụp ở độ phân giải cao nhất có sẵn và thu nhỏ trong máy tính. Ngoài ra, chọn jpeg chất lượng cao nhất bạn có thể nhận được từ máy ảnh của mình hoặc thậm chí là chụp thô nếu máy ảnh của bạn cho phép và chuyển đổi thành tiff hoặc png. Nén mất dữ liệu trong jpeg có thể tạo ra các tạo phẩm xung quanh ranh giới mực / giấy có thể gây nhầm lẫn cho phần mềm ocr của bạn.

Nói chung, những gì bạn muốn làm là sử dụng các cài đặt sẽ có được hình ảnh sắc nét nhất bạn có thể nhận được. Những thứ như độ tương phản, cân bằng trắng, vv có thể được thay đổi trong máy tính. Trên thực tế, việc tăng độ tương phản bằng cách sử dụng công cụ cấp độ hoặc công cụ độ tương phản / độ sáng trong photoshop hoặc GIMP có thể giúp bạn rất nhiều.

Ngoài ra, chuyển đổi sang định dạng thang độ xám sẽ làm giảm đáng kể kích thước tệp của bạn. Và nếu bạn làm điều đó và tăng độ tương phản, bạn không thực sự phải lo lắng về cân bằng trắng. Bạn có thể thử nghiệm với cân bằng trắng, tuy nhiên, một số cài đặt có thể tạo độ tương phản tốt hơn các cài đặt khác (tùy thuộc vào ánh sáng của bạn).

Nếu máy tính của bạn có thể xử lý nó, hãy thực hiện tất cả các điều chỉnh (thang độ xám, độ tương phản, độ sáng) trước khi bạn thu nhỏ kích thước và sau khi thu nhỏ kích thước, áp dụng một số bộ lọc làm sắc nét cho hình ảnh.


1

Một vài suy nghĩ, mà tôi đã không nhận thấy ở nơi khác, để thêm vào hỗn hợp:

  • Nếu bạn chụp "phóng to" (nhiều ống kính hơn ), nó sẽ khiến bạn bắn xa hơn từ trang, sau đó sẽ cho bạn một hình ảnh phù hợp hơn với kích thước văn bản (các từ trong một góc sẽ gần hơn với cùng kích thước với các từ ở giữa, với góc rộng, bạn có thể bị biến dạng đối với điều này). Tôi không chắc cài đặt "lý tưởng" là gì, ở đây, và đó là sự đánh đổi với tốc độ màn trập yêu cầu, có khả năng, chỉ là một cái gì đó để suy nghĩ.

  • Theo mặc định, bạn sẽ muốn " phơi sáng quá mức " so với những gì máy ảnh của bạn nghĩ là đúng (trừ khi nó đủ thông minh để đoán rằng đây là giấy - tôi đặt nó trong ngoặc kép vì bạn không thực sự muốn phơi bày quá mức , chỉ phơi sáng quá mức dựa trên đo sáng của một trang trắng), bởi vì tông màu chính (chính giấy) sẽ là thứ chính mà máy ảnh cố gắng phơi bày và nếu bạn phơi sáng giấy là màu xám ở giữa, bạn sẽ có một điểm khởi đầu lầy lội. Nếu bạn "quá mức" bởi một điểm dừng và một nửa đến 2 điểm dừng (chỉ không đi đến điểm cắt nổi bật), văn bản vẫn phải đẹp và tối, nhưng giấy sẽ đẹp và sáng, tạo ra sự tách biệt tương phản ( và do đó OCR) dễ dàng hơn.

  • cố gắng có ánh sáng đều - nếu một góc của trang sáng hơn hoặc tối hơn nhiều so với góc khác, điều này sẽ khiến việc phân tách mọi thứ thành màu đen và trắng tinh khiết mà bạn rất muốn cho mục đích OCR.

  • một "bản sao" là lý tưởng cho các dự án như thế này, mặc dù tôi cho rằng vượt quá những gì bạn có thể dễ dàng có trong thư viện ... Tuy nhiên, tùy thuộc vào cách thư viện của bạn được định cấu hình, có thể có một nơi nào đó (có thể là một kệ bàn, hoặc một thanh giữ ánh sáng hoặc tương tự?) mà bạn có thể đặt một siêu kẹp với đầu bóng ( đây là một , nhưng bất kỳ siêu kẹp nào có kích thước phù hợp (tùy thuộc vào đầu) "đinh" và một số loại giá ba chân đầu sẽ làm) và máy ảnh của bạn sau đó sẽ được gắn trên bề mặt bàn (hoặc bất cứ thứ gì), để bạn có thể có vị trí nhất quán và ổn định trong trường hợp bạn cần phơi sáng lâu hơn. Về cơ bản, số tiền này sẽ tương đương với một bản sao "người nghèo".

    Bạn cũng có thể muốn sử dụng chế độ hẹn giờ ngắn hoặc điều khiển từ xa (Tôi tưởng tượng máy ảnh của bạn có chế độ hẹn giờ 2 giây và có lẽ là tùy chỉnh có thể ngắn hơn nữa), để tránh rung máy khi nhấn nút.

Đó là tất cả những gì tôi nghĩ đến lúc này. Hy vọng rằng điều đó hữu ích.


1

Tôi có công việc giống như bạn chụp ảnh đất và đã thực hiện nó trong nhiều năm. Hầu hết mọi người không biết họ đang nói về điều gì, hãy tin tôi !!!

  1. Camera trên M hoặc thủ công

  2. Iso 100-200 càng cao # càng sáng nhưng nó càng thu được nhiều hạt hoặc nhiễu trong ảnh

  3. Tốc độ màn trập 1/100 đến 1/160 (thường là 1/125 là tốt nhất, càng thấp càng sáng nhưng bạn càng nhận được nhiều chôn hoặc thử lại)

  4. Khẩu độ hoặc f2.7 (tại sao bạn cần một tầm nhìn sâu rộng, đó là một trang phẳng)

  5. Chụp màu, 6 đến 10 megapixel, xem qua các cài đặt cân bằng trắng của bạn, thường là huỳnh quang 1 hoặc 2, tắt hầu hết các chuông và còi nếu Ur không chắc chắn tắt nó đi

  6. phơi ảnh trên comp bằng acdc


0

Một số gợi ý nhỏ, nhưng tôi nghĩ rằng thiết lập của bạn có vẻ tốt

  1. Sử dụng chân máy. Điều này sẽ loại bỏ bất kỳ vấn đề nào với rung máy và cho phép bạn sử dụng thời gian phơi sáng mà bạn cần.

  2. Tránh ánh sáng chiếu trực tiếp vào tờ giấy ở một góc có thể phản chiếu thẳng vào ống kính và gây ra điểm nhấn ở nơi bạn không muốn. Điều này thường có nghĩa là đảm bảo ánh sáng đến từ hai bên.

  3. ISO: Theo nguyên tắc thông thường, bạn nên hướng tới giá trị thấp hơn, nhưng tôi chắc chắn rằng bất kỳ sự khác biệt nào về vật chất sẽ nhanh chóng trở nên rõ ràng.

Ngoài ra, tôi không thể nghĩ ra bất kỳ cách nào để cải thiện thiết lập của bạn. Thành thật mà nói, tôi nghĩ rằng bạn đã có nó.


Bạn có thể đề xuất một giá ba chân tốt (và tương đối rẻ tiền) sẽ hữu ích và cho phép tôi lật máy ảnh để nó đối diện song song với các trang tôi đang chụp không? Tôi đã nhìn vào giá ba chân của Joby và chúng có vẻ đầy hứa hẹn, nhưng tôi đã nghe nói rằng chúng thường thay đổi khi bạn chạm vào màn trập.
Jason

@Jason, điểm công bằng. Tôi có một Joby, cái mà tôi thích, nhưng để ngăn nó di chuyển khi bạn nhấn màn trập, chỉ cần sử dụng một bản phát hành màn trập từ xa hoặc sử dụng chế độ hẹn giờ. Đây thực sự là một mẹo hay cho bất cứ khi nào bạn sử dụng tốc độ màn trập chậm. Tin xấu là bất kỳ chân máy nào đủ nặng để rất ổn định sẽ không rẻ. Xin lỗi vì điều đó! (Nếu bạn tìm ra cách khác, hãy cho tôi biết!);)
AJ Finch

0

Có vẻ như bạn đã có hầu hết các câu trả lời :-P Tôi sẽ chỉ thêm một vài nhận xét về quan điểm của bạn:

  1. Độ phân giải: bạn nói đúng, bạn sẽ không cần nhiều độ phân giải ở đây, đặc biệt nếu bạn chỉ đang xem hình ảnh trên màn hình. Tôi có thể tự giới hạn nó ở độ phân giải màn hình tối đa gấp đôi.

  2. Khẩu độ: bạn đúng với việc chọn khẩu độ nhỏ hơn để có được một chút độ sâu của phòng ngọ nguậy. Tuy nhiên, có lẽ bạn sẽ không cần nhiều thứ. Chơi với độ sâu của máy tính trường cho độ dài tiêu cự của bạn, tìm ra một DOF hợp lý, sau đó đi với khẩu độ lớn nhất bạn có thể. (Tuy nhiên, đảm bảo bạn dừng hoặc hai lần dưới khẩu độ tối đa để có độ sắc nét tốt nhất.) Bạn muốn khẩu độ lớn nhất để bạn có thể có nhiều chỗ hơn để chơi với màn trập và ISO; xem bên dưới.

  3. Shutter: rõ ràng bạn muốn điều này càng nhanh càng tốt để giảm rung, trong khi vẫn nhận được đủ ánh sáng. Tôi đã nghe nhiều nguồn khác nhau tuyên bố "tốc độ màn trập bằng độ dài tiêu cự" để tránh rung lắc; một số yêu cầu gấp đôi. Vì vậy, nếu bạn đang sử dụng ống kính 50mm, hãy cố gắng giữ tốc độ màn trập trong khoảng từ 1/50 đến 1/100. Khi bạn đã có điều đó, hãy thử tốc độ chậm nhất để tối đa hóa ánh sáng.

  4. ISO: bạn sẽ có thể tăng mức này khá cao. Tiếng ồn có thể làm giảm hình ảnh của bức ảnh nhưng có lẽ sẽ không làm giảm khả năng đọc của nó quá nhiều. "ISO cao" và "quá ồn" phụ thuộc vào máy ảnh của bạn. Thí nghiệm. Đây có lẽ là cách tốt nhất để bạn có được độ phơi sáng chính xác trong điều kiện ánh sáng yếu, so với khẩu độ và màn trập.

  5. Cân bằng trắng: đối với bạn, nó không quá quan trọng. Nếu giấy chụp ảnh của bạn trông trắng ra, có vấn đề gì không? (Câu chuyện khác nhau nếu bạn đang chụp ảnh sách với hình ảnh đầy màu sắc tất nhiên). Nếu bạn muốn sửa nó trong bài viết, bạn sẽ có một thời gian tương đối dễ dàng, vì bạn có rất nhiều giấy màu trung tính để làm việc. Có lẽ tôi sẽ để máy ảnh của bạn ở chế độ Cân bằng trắng tự động và quên nó đi.

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.