Câu hỏi này đã được trả lời rất tốt từ các quan điểm khác nhau, và tôi chỉ muốn tóm tắt kinh nghiệm của mình và cũng nhấn mạnh một số vấn đề liên quan đến binarization thích ứng.
Binarization thích ứng có thể được chia thành ba loại:
1) Phương pháp toàn cầu: với phương pháp này trước tiên, nền của hình ảnh được ước tính; sau đó một hình ảnh chuẩn hóa được tạo ra với sự trợ giúp của thông tin cơ bản. Sau đó, phương pháp binarization toàn cầu được sử dụng.
2) Phương pháp dựa trên bản vá: như tên gọi, phương pháp dựa trên bản vá sẽ thực hiện bản vá nhị phân bằng bản vá. Ở mỗi bản vá, một phép tính nhị phân được ước tính bằng phương pháp nhị phân toàn cục. Sau đó, một số xử lý hậu kỳ được thực hiện để khởi kiện rằng ngưỡng nhị phân trong các bản vá lân cận có sự chuyển tiếp suôn sẻ.
3) Phương pháp cửa sổ di chuyển: với phương pháp này, quá trình tạo nhị phân được thực hiện theo pixel. Một cửa sổ di chuyển được thiết lập để tính toán số liệu thống kê pixel trong cửa sổ và dựa trên số liệu thống kê, ngưỡng cho pixel trung tâm trong cửa sổ được tính toán.
Rất khó để nói phương pháp nào là tốt nhất vì nó phụ thuộc vào ứng dụng. Khi bạn nghĩ về một nhị phân thích ứng, đừng quên xem xét các câu hỏi sau:
1) cài đặt tham số: phương thức có quy trình cài đặt tham số tự động không? Làm thế nào chúng ta có thể thiết lập các tham số rất tốt để nó có thể hoạt động trên hầu hết các trường hợp?
2) các tiêu chí của việc biện minh cho một binarization thích ứng tốt là gì? Trong nhiều trường hợp, sự khác biệt giữa các phương pháp nhị phân khác nhau là rất nhỏ. Tuy nhiên, sự khác biệt nhỏ có thể dẫn đến sự khác biệt lớn cuối cùng.
3) binarization có thể làm việc trên một số tình huống cụ thể? Ví dụ, giả sử mục tiêu của binarization thích ứng là trích xuất trong khi các đối tượng từ nền đen, liệu binarization có thể tự động thích ứng với tình huống này không? Hoặc phó visa.
4) phương pháp thích ứng có xu hướng chỉ tập trung vào các cấu hình cục bộ, do đó kết quả nhị phân không được tối ưu hóa. Ví dụ, phương pháp Sauvola nổi tiếng sẽ tạo ra đối tượng rỗng nếu đối tượng được tối ưu hóa lớn hơn nhiều so với cửa sổ chuyển động. Phương pháp thích ứng của bạn có thể vượt qua giới hạn này?
5) tiền xử lý. Một binarization tốt cũng nên bao gồm nội bộ xử lý hình ảnh. Nếu hình ảnh quá mờ, nó có thể tự động điều chỉnh các tham số của thuật toán hoặc gọi một số tiền xử lý để tránh hiện tượng nhị phân xấu.