Tôi gặp sự cố khi chạy công cụ tesseract-ocr trên linux. Tôi đã tải xuống dữ liệu ngôn ngữ RUS và đưa nó vào thư mục tessdata (/ usr / local / share / tessdata). Khi tôi đang cố gắng chạy tesseract bằng lệnh tesseract blob.jpg out -l rus
, nó sẽ hiển thị lỗi:
Error opening data file /usr/local/share/tessdata/eng.traineddata
Please make sure the TESSDATA_PREFIX environment variable is set to the parent directory of your "tessdata" directory.
Failed loading language eng
Tesseract couldn't load any languages!
Could not initialize tesseract.
Theo hướng dẫn biên dịch , tôi đã sử dụng export TESSDATA_PREFIX='/usr/local/share/'
để trỏ thư mục tessdata của mình. Có lẽ tôi nên chỉnh sửa bất kỳ tệp cấu hình nào? Tesseract cố gắng tải các tệp dữ liệu 'eng' thay vì 'rus'.
Ảnh chụp màn hình: http://i.stack.imgur.com/I0Guc.png