Hiểu biết về quy mô không gian


10

Trong lý thuyết quy mô không gian đại diện quy mô không gian của tín hiệu , (trong trường hợp hình ảnh d = 2 ) được đưa ra như: L ( x , y ; t ) = g ( x , y ; t ) f ( x , y ) trong đó g ( x ,f(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y) là một gaussian hạt nhân với tham số t * là một chập. Bằng cách thay đổitham số t, chúng tôi nhận được một hình ảnh được làm mịn ít nhiều. Vì đại diện cho kết quả thô hơn (tham số t ) sẽ không chứa các đối tượng nhỏ hoặc nhiễu.g(x,y;t)ttt

Điểm chính là tìm cách phát hiện tính năng bất biến tỷ lệ, phải không? Vì vậy, đối với một số hình ảnh có kích thước giảm, sao chép các tính năng như điểm chính sẽ được phát hiện chính xác, ngay cả khi kích thước khác nhau, mà không tìm thấy các điểm chính nhiễu khác.

  1. Trong bài báo mà họ đang sử dụng dẫn xuất -normalized. δ ξ , γ - n o r m = t γ / 2 δ x . Ý nghĩa của việc sử dụng là gì γ -normalized phái sinh, như thế nào nó giúp về quy mô-invariancy?γδξ,γnorm=tγ/2δxγ

  2. Từ hình ảnh này, chúng ta có thể thấy rằng ở gần các vị trí giống nhau, các điểm chính khác nhau được tìm thấy (kích thước khác nhau). Làm thế nào là có thể?

Các tính năng được phát hiện

x,ytL(x,y)t

Bài báo tôi đang đọc là: Phát hiện tính năng với lựa chọn tỷ lệ tự động

Câu trả lời:


3
  1. γtt

  2. Bạn có thể tìm thấy các điểm chính ở nhiều tỷ lệ trong cùng một vị trí. Đó là bởi vì bạn tìm kiếm cực đại cục bộ trên quy mô. Đây là trực giác: nghĩ về hình ảnh khuôn mặt. Ở quy mô tốt, bạn nhận được một đốm tương ứng với mũi. Ở quy mô khóa học, bạn nhận được một đốm màu tương ứng với toàn bộ khuôn mặt. Hai đốm màu nằm ở cùng một điểm, nhưng có tỷ lệ khác nhau.

  3. Đây là toàn bộ thuật toán:

    • Quyết định các tính năng hình ảnh mà bạn quan tâm (ví dụ như các đốm, góc, cạnh)
    • Xác định một "hàm dò" tương ứng theo các dẫn xuất, ví dụ Laplacian cho các đốm màu.
    • Tính toán các dẫn xuất mà bạn cần cho chức năng dò của bạn ở một phạm vi tỷ lệ.
    • tmγ/2m
    • Tính toán hàm dò trên toàn bộ không gian tỷ lệ.
    • x,y,t
    • Đây là những điểm quan tâm của bạn, hoặc điểm chính.

Biên tập:

  1. tγ/2
  2. txytxy
  3. Bạn muốn tìm cực đại cục bộ trên tỷ lệ vì bạn có thể có các tính năng hình ảnh có kích thước khác nhau ở cùng một vị trí. Hãy nghĩ về một hình ảnh của các vòng tròn đồng tâm, giống như mắt bò. Nó sẽ cung cấp cho bạn phản hồi cao của một Laplacian ở nhiều quy mô. Hoặc nghĩ về một hình ảnh của một con người thực sự được lọc bởi Laplacian ở một phạm vi tỷ lệ. Bạn sẽ nhận được phản hồi cao ở thang điểm tốt cho đồng tử, phản hồi cao ở mức trung bình đối với mống mắt và phản hồi cao ở thang điểm thô cho toàn bộ mắt.

Toàn bộ vấn đề là bạn không biết ở quy mô nào các tính năng quan tâm có thể đi trước thời đại. Vì vậy, bạn nhìn vào tất cả các quy mô.


tγ/2tttx,y

x,y,tt

@maximus Xin vui lòng xem chỉnh sửa để trả lời.
Dima

@maximus, tôi đã hiểu sai trước đây. gamma không phải là cấp độ quy mô. Tôi đã sửa câu trả lời.
Dima
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.