Tôi đã qua chỗ của ông bà tôi vào cuối tuần qua. Bà tôi đã lôi cuốn sách khổng lồ (~ 1400 trang) này về lịch sử gia đình của bà từ năm 1630 trở đi. Tôi là một người khổng lồ, tôi nghĩ rằng sẽ rất khó để có tất cả thông tin được lưu trữ trong cơ sở dữ liệu và có sẵn trên web. Tôi có thể xử lý tất cả các chương trình web và các biểu thức thông thường và những gì không, nhưng điều tôi không biết là cách tốt nhất để chuyển văn bản từ sách sang máy tính.
Tôi biết một số loại OCR sẽ là cần thiết, từ nghiên cứu nhỏ mà tôi đã thực hiện, có vẻ như các lựa chọn của tôi là:
- chụp ảnh mọi trang bằng máy ảnh sau đó xử lý ảnh bằng phần mềm OCR
- sử dụng máy quét để quét từng trang, sau đó xử lý bằng phần mềm OCR
- sử dụng một số loại thiết bị cầm tay, như thế này .
Có ai có bất kỳ ý tưởng về cách tốt nhất để giải quyết vấn đề này? Tôi không muốn phá hủy cuốn sách, vì theo như tôi biết, nó không thể bị thay thế. Đây có lẽ là lần duy nhất tôi sẽ quét một cuốn sách lớn, vì vậy tôi không nghĩ rằng tôi muốn chi hơn 250 đô la cho bất kỳ loại thiết bị nào. Tôi không ngại một số nỗ lực thủ công ở đây (tôi nhận ra điều này rất có thể sẽ mất vài tháng), nhưng tôi muốn tìm ra phương pháp hiệu quả nhất có thể.
Lưu ý về cuốn sách: Nó chỉ khoảng 20 tuổi, vì vậy nó có hình dạng khá tốt. Đó là màu đơn sắc và các trang chưa bắt đầu màu vàng. Vì nó quá lớn, tôi lo lắng về các bóng có thể xảy ra khi văn bản xuống gần với ràng buộc.