Toán học phát hiện điểm góc Harris


23

Đây là biểu thức toán học để phát hiện góc Harris:

Đây là biểu thức toán học để phát hiện góc Harris ...

Nhưng tôi có những nghi ngờ sau:

  1. Ý nghĩa vật lý của v là gì? Nhiều tài liệu tham khảo nói rằng đó là độ lớn mà cửa sổ w thay đổi. Vì vậy, cửa sổ được dịch chuyển bao nhiêu? Một pixel hay hai pixel?uvw
  2. Là tổng kết trên các vị trí pixel được bao phủ bởi cửa sổ?
  3. Giả sử đơn giản , I ( x , y ) là cường độ của pixel đơn tại ( x , y ) hoặc tổng của cường độ bên trong cửa sổ với tâm tại ( x , y ) ?w(x,y)=1I(x,y)(x,y)(x,y)
  4. Theo wiki họ nói rằng hình ảnh là 2D, ký hiệu là I và sau đó yêu cầu xem xét một bản vá hình ảnh trên khu vực , sau đó sử dụng ký hiệu I ( x , y )(x,y)I(x,y)

Tôi đang tìm thấy nó khó hiểu để nắm bắt các giải thích toán học. Bất cứ ai cũng có một ý tưởng?


2
Kiểm tra bài giảng này trên máy dò góc Harris. Điều đó rất rõ ràng: youtube.com/watch?v=P35WsRDnTsU&t=41m12s

Tôi đã viết một bài trong blog cá nhân của tôi dựa trên bài giảng ở trên. matlabcorner.wordpress.com/2012/11/17/ ích
Andrey Rubshtein

Câu trả lời:


31

Ý nghĩa của công thức đó thực sự khá đơn giản. Hãy tưởng tượng bạn chụp hai vùng nhỏ có cùng kích thước của một hình ảnh, một màu xanh và một màu đỏ:

nhập mô tả hình ảnh ở đây

Hàm cửa sổ bằng 0 bên ngoài hình chữ nhật màu đỏ (để đơn giản, chúng ta có thể giả sử cửa sổ đơn giản là không đổi trong hình chữ nhật màu đỏ). Vì vậy, chức năng cửa sổ chọn những pixel bạn muốn xem và gán trọng số tương đối cho từng pixel. (Phổ biến nhất là cửa sổ Gaussian, vì nó đối xứng xoay, hiệu quả để tính toán và nhấn mạnh các pixel ở gần trung tâm của cửa sổ.) Hình chữ nhật màu xanh được dịch chuyển bởi (u, v).

Tiếp theo, bạn tính tổng hiệu số bình phương giữa các phần hình ảnh được đánh dấu màu đỏ và màu xanh lam, tức là bạn trừ đi pixel của chúng theo pixel, bình phương độ chênh lệch và tổng hợp kết quả (giả sử, để đơn giản rằng cửa sổ = 1 trong khu vực chúng ta đang tìm kiếm tại). Điều này cung cấp cho bạn một số cho mọi khả năng (u, v) -> E (u, v).

Hãy xem điều gì xảy ra nếu chúng ta tính toán cho các giá trị khác nhau của u / v:

Đầu tiên giữ v = 0:

nhập mô tả hình ảnh ở đây

Điều này không có gì đáng ngạc nhiên: Sự khác biệt giữa các phần hình ảnh là thấp nhất khi độ lệch (u, v) giữa chúng là 0. Khi bạn tăng khoảng cách giữa hai miếng vá, tổng chênh lệch bình phương cũng tăng.

Giữ u = 0:

nhập mô tả hình ảnh ở đây

Cốt truyện trông tương tự nhau, nhưng tổng số khác biệt bình phương giữa hai phần hình ảnh nhỏ hơn rất nhiều khi bạn dịch chuyển hình chữ nhật màu xanh theo hướng của cạnh.

Một cốt truyện đầy đủ của E (u, v) trông như thế này:

nhập mô tả hình ảnh ở đây

Cốt truyện trông hơi giống một "hẻm núi": Chỉ có một sự khác biệt nhỏ nếu bạn dịch chuyển hình ảnh theo hướng của hẻm núi. Đó là bởi vì bản vá hình ảnh này có hướng chủ đạo (dọc).

Chúng tôi có thể làm tương tự cho một bản vá hình ảnh khác nhau:

nhập mô tả hình ảnh ở đây

Ở đây, cốt truyện của E (u, v) trông khác nhau:

nhập mô tả hình ảnh ở đây

Bất kể bạn thay đổi miếng vá theo cách nào, nó luôn trông khác biệt.

Vì vậy, hình dạng của hàm E (u, v) cho chúng ta biết điều gì đó về bản vá hình ảnh

  • nếu E (u, v) gần 0 ở mọi nơi, không có kết cấu nào trong bản vá hình ảnh bạn đang xem
  • nếu E (u, v) là "hình hẻm núi", bản vá có hướng chủ đạo (đây có thể là cạnh hoặc kết cấu)
  • nếu E (u, v) là "hình nón", miếng vá có kết cấu, nhưng không có hướng chủ đạo. Đó là loại miếng vá mà máy dò góc đang tìm kiếm.

Nhiều tài liệu tham khảo nói rằng đó là độ lớn mà cửa sổ 'w' dịch chuyển ... vậy cửa sổ bị dịch chuyển bao nhiêu? Một pixel ... hai pixel?

Thông thường, bạn không tính E (u, v). Bạn chỉ quan tâm đến hình dạng của nó trong vùng lân cận của (u, v) = (0,0). Vì vậy, bạn chỉ muốn bản mở rộng Taylor của E (u, v) gần (0,0), mô tả hoàn toàn "hình dạng" của nó.

Là tổng kết trên các vị trí pixel được bao phủ bởi cửa sổ?

Về mặt toán học, sẽ thanh lịch hơn khi để phạm vi tổng trên tất cả các pixel. Thực tế mà nói, không có điểm nào trong việc tính tổng các pixel trong đó cửa sổ bằng 0.


thanx tấn Nikie ....
rotating_image

2
Tôi biết bạn sẽ nhận được một câu trả lời tuyệt vời ở đây, @rotating_image
karlphillip

thanx karlphillip ..
rotating_image

1
Một triệu lượt upvote!
Phonon
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.