Trong phần trao đổi TeX, chúng tôi đã thảo luận về cách phát hiện "các dòng sông" trong các đoạn trong câu hỏi này .
Trong bối cảnh này, các dòng sông là các dải không gian màu trắng xuất phát từ sự liên kết ngẫu nhiên của các không gian từ trong văn bản. Vì điều này có thể gây mất tập trung cho người đọc, những dòng sông xấu được coi là một triệu chứng của kiểu chữ kém. Một ví dụ về văn bản với các con sông là cái này, nơi có hai con sông chảy theo đường chéo.
Có mối quan tâm trong việc phát hiện các con sông này một cách tự động, để chúng có thể tránh được (có thể bằng cách chỉnh sửa thủ công văn bản). Raphink đang đạt được một số tiến bộ ở cấp độ TeX (chỉ biết về vị trí glyph và hộp giới hạn), nhưng tôi cảm thấy tự tin rằng cách tốt nhất để phát hiện các dòng sông là xử lý hình ảnh (vì hình dạng glyph rất quan trọng và không có sẵn cho TeX) . Tôi đã thử nhiều cách khác nhau để trích xuất các dòng sông từ hình ảnh trên, nhưng ý tưởng đơn giản của tôi về việc áp dụng một lượng nhỏ làm mờ hình elip dường như không đủ tốt. Tôi cũng đã thử một số RadonLọc dựa trên biến đổi Hough, nhưng tôi cũng không nhận được bất cứ nơi nào với những cái đó. Các con sông rất dễ thấy các mạch phát hiện tính năng của mắt / võng mạc / não người và bằng cách nào đó tôi nghĩ rằng nó có thể được dịch sang một loại hoạt động lọc nào đó, nhưng tôi không thể làm cho nó hoạt động. Có ý kiến gì không?
Cụ thể, tôi đang tìm kiếm một số hoạt động sẽ phát hiện 2 con sông trong hình trên, nhưng không có quá nhiều phát hiện dương tính giả khác.
EDIT: endolith đã hỏi tại sao tôi theo đuổi cách tiếp cận dựa trên xử lý hình ảnh cho rằng trong TeX chúng tôi có quyền truy cập vào các vị trí glyph, khoảng cách, v.v. và có thể sử dụng thuật toán kiểm tra văn bản thực tế nhanh hơn và đáng tin cậy hơn nhiều. Lý do của tôi để làm mọi thứ theo cách khác là hình dạngcủa glyphs có thể ảnh hưởng đến mức độ đáng chú ý của một dòng sông, và ở cấp độ văn bản, rất khó để xem xét hình dạng này (điều này phụ thuộc vào phông chữ, vào ligaturing, v.v.). Để biết ví dụ về cách hình dạng của glyphs có thể quan trọng, hãy xem xét hai ví dụ sau, trong đó điểm khác biệt giữa chúng là tôi đã thay thế một vài glyphs bằng các glyphs khác có cùng chiều rộng, để phân tích dựa trên văn bản sẽ xem xét họ tốt / xấu như nhau. Tuy nhiên, lưu ý rằng các con sông trong ví dụ đầu tiên tồi tệ hơn nhiều so với trong lần thứ hai.
ImageLines[]
từ Mathicala, có và không có một số tiền xử lý. Tôi đoán đây là kỹ thuật sử dụng biến đổi Hough chứ không phải Radon. Tôi sẽ không ngạc nhiên nếu quá trình tiền xử lý thích hợp (Tôi đã không thử bộ lọc giãn nở được đề xuất của datageist) và / hoặc cài đặt tham số có thể làm cho công việc này hoạt động.