Là một phụ lục cho câu trả lời của Penelope , hai gia đình phổ biến (và hợp thời trang) về thuật toán.
Siêu phẩm
Một họ thuật toán rất phổ biến được gọi là Superpixels hiện đang rất hợp thời (thậm chí có một số phiên Superpixel trong các hội nghị CV). Superpixels rất giống như phân đoạn quá mức (như những gì đầu nguồn mang lại cho bạn), vì vậy một số xử lý hậu kỳ là bắt buộc.
Superpixels có thể được xem là vùng hình ảnh đồng nhất nhỏ . Khoảng cách giữa các pixel được đánh giá là trong lọc song phương, nghĩa là, đó là sự pha trộn giữa khoảng cách không gian của chúng và độ tương tự hình ảnh của chúng bằng 0 khi chúng gần và giống nhau và với một số giá trị lớn hơn.
Sau đó, các phương pháp superpixels thử các tiêu chí khác nhau để tạo thành các vùng đồng nhất nhỏ đối với biện pháp này. Có rất nhiều trong số chúng (dựa trên biểu đồ, tìm kiếm chế độ / phân cụm dựa trên ...), vì vậy tôi đoán rằng tốt nhất nên giới thiệu bạn đến báo cáo công nghệ này .
(chỉnh sửa :) Trong trường hợp ai đó đang tìm kiếm một tác phẩm được đánh giá ngang hàng được xuất bản, bài viết này là của cùng các tác giả và bao gồm cùng một tài liệu như báo cáo công nghệ:
R. Achanta, A. Shaji, K. Smith, A. Lucchi, P. Fua, S. Susstrunk: SLIC Superpixels So với các phương pháp Superpixel hiện đại
Lưu ý khi tôi viết phiên bản đầu tiên của câu trả lời rằng trực quan các kết quả rất giống với những gì phân khúc đầu nguồn cung cấp cho bạn. Điều này được xác nhận bởi các tác giả của báo cáo công nghệ bao gồm các lưu vực sông trong phần công việc liên quan. Do đó, bạn cũng cần thực hiện xử lý hậu kỳ tương tự: trong khi superpixels có thể là các tính năng tiện dụng để sử dụng thay vì pixel, chúng vẫn cần được nhóm lại để tạo thành các khu vực cấp cao hơn nếu bạn cần theo dõi / phát hiện đối tượng.
Phương pháp phân đoạn dựa trên đồ thị
Một họ thuật toán phổ biến khác đến từ việc phân tích mối quan hệ pixel, tức là cách các pixel gần nhau xuất hiện. Điều này mang lại một họ các phương pháp phân đoạn dựa trên lý thuyết đồ thị như cắt bình thường hóa (J. Shi, J. Malik: Cắt bình thường hóa và Phân đoạn hình ảnh ) .
Đây là trực giác cho phương pháp này: giả sử các pixel của bạn bây giờ là các điểm (đỉnh) của đồ thị chiều cao.
Trong biểu đồ, hai đỉnh có thể được kết nối bởi một cạnh , có trọng lượng tỷ lệ nghịch với một khoảng cách giữa các đỉnh. Thông thường, hàm trọng số sẽ là một số đối ứng của sự pha trộn giữa khoảng cách không gian của chúng và độ tương tự thị giác của chúng 8as trong lọc song phương).
Sau đó, được đưa ra biểu đồ này, các thuật toán phân đoạn có thể tìm kiếm các cụm tốt nhất của đỉnh, tức là, nhóm các đỉnh có một nhỏ trong nội bộ nhóm khoảng cách và một lớn thêm nhóm khoảng cách.
Trong phương pháp Cắt chuẩn hóa, một số chăm sóc bổ sung được thực hiện để tránh mọi sai lệch được đưa ra bởi các kích thước dân số khác nhau của các cụm. Hơn nữa, thăm dò đồ thị có thể tránh được bằng cách tính toán SVD của ma trận trọng số, còn được gọi là ma trận kết nối trong lý thuyết đồ thị.