Tôi đang cố gắng "khớp" các mảng vuông nhỏ trong một hình ảnh. Thoạt nhìn, có vẻ hợp lý khi chỉ cần thực hiện so sánh kiểu khoảng cách Euclide của hai trong số các mảng này để có được số đo "tương tự". Điều này hoạt động tốt trong nhiều trường hợp (bản vá "tốt nhất" (giá trị thấp nhất) theo số liệu này trông rất giống với bản vá truy vấn). Tuy nhiên, có nhiều trường hợp điều này tạo ra một trận đấu rất tệ. Ví dụ: lấy hai cặp vá này:
Hai bản vá của một bức tường gạch, điểm 134 (đây là tổng của các thành phần của chênh lệch pixel tuyệt đối trung bình):
Một mảng tường gạch, một mảng cỏ, điểm 123!
Đối với một con người, "rõ ràng" cỏ không khớp với cục gạch, nhưng số liệu này lại nói khác. Vấn đề chỉ là trong các biến thể thống kê địa phương.
Nếu tôi sử dụng một cái gì đó như so sánh biểu đồ, tôi hoàn toàn mất tất cả thông tin không gian - ví dụ: nếu một miếng vá là cỏ trên đỉnh và gạch ở dưới cùng, nó sẽ khớp chính xác với một miếng vá với cỏ ở dưới và gạch ở trên cùng (một lần nữa , một trận đấu "rõ ràng sai" khác).
Có một số liệu nào đó kết hợp cả hai ý tưởng này thành một giá trị hợp lý sẽ đánh giá là "tương tự" cho Cặp 1 ở trên, nhưng cũng không giống với ví dụ của tôi về một bản vá và gương dọc của nó?
Mọi góp ý đều được đánh giá cao!