Cách tốt nhất để phát hiện các góc của hóa đơn / biên lai / tờ giấy trong ảnh là gì? Điều này sẽ được sử dụng để hiệu chỉnh phối cảnh tiếp theo, trước OCR.
Cách tiếp cận hiện tại của tôi là:
RGB> Xám> Phát hiện cạnh Canny với ngưỡng> Dilate (1)> Loại bỏ các đối tượng nhỏ (6)> xóa các đối tượng nội trú> chọn blog lớn dựa trên Khu vực Lồi. > [phát hiện góc - Không được triển khai]
Tôi không thể không nghĩ rằng phải có một cách tiếp cận thống kê / 'thông minh' mạnh mẽ hơn để xử lý loại phân đoạn này. Tôi không có nhiều ví dụ đào tạo, nhưng tôi có thể có được 100 hình ảnh với nhau.
Bối cảnh rộng lớn hơn:
Tôi đang sử dụng matlab để làm nguyên mẫu và dự định triển khai hệ thống trong OpenCV và Tesserect-OCR. Đây là vấn đề đầu tiên trong số các vấn đề về xử lý hình ảnh mà tôi cần giải quyết cho ứng dụng cụ thể này. Vì vậy, tôi đang tìm cách đưa ra giải pháp của riêng mình và làm quen lại với các thuật toán xử lý hình ảnh.
Dưới đây là một số hình ảnh mẫu mà tôi muốn thuật toán xử lý: Nếu bạn muốn thực hiện thử thách, các hình ảnh lớn có tại http://madteckhead.com/tmp
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
Trong trường hợp tốt nhất, điều này mang lại:
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
Tuy nhiên, nó dễ dàng thất bại trong các trường hợp khác:
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
(nguồn: madteckhead.com )
Cảm ơn trước cho tất cả những ý tưởng tuyệt vời! Tôi yêu SO!
CHỈNH SỬA: Tiến trình chuyển đổi Hough
H: Thuật toán nào sẽ phân cụm các đường hough để tìm các góc? Theo lời khuyên từ các câu trả lời, tôi đã có thể sử dụng Hough Transform, chọn các dòng và lọc chúng. Cách tiếp cận hiện tại của tôi là khá thô. Tôi đã giả định rằng hóa đơn sẽ luôn nhỏ hơn 15deg so với hình ảnh. Tôi kết thúc với kết quả hợp lý cho các dòng nếu trường hợp này xảy ra (xem bên dưới). Nhưng tôi không hoàn toàn chắc chắn về một thuật toán phù hợp để phân cụm các đường (hoặc bỏ phiếu) để ngoại suy cho các góc. Các đường Hough không liên tục. Và trong các hình ảnh nhiễu, có thể có các đường thẳng song song vì vậy cần có một số hình thức hoặc khoảng cách từ số liệu gốc đường. Bất kỳ ý tưởng?
(nguồn: madteckhead.com )