Mô tả tính năng bất biến tỷ lệ và xoay


16

Bạn có thể liệt kê một số mô tả tính năng bất biến tỷ lệ và xoay để sử dụng trong phát hiện tính năng.

Ứng dụng này là để phát hiện xe hơi và con người trong video được quay bởi UAV, sử dụng trình phân loại nhiều lớp.

Cho đến nay tôi đã xem xét SIFT và MSER (đó là bất biến affine). Tôi cũng đã xem LESH, LESH dựa trên mô hình năng lượng cục bộ, nhưng được tính theo cách không bất biến xoay vòng, tôi đã cố gắng nghĩ cách sử dụng năng lượng Địa phương, để xây dựng một bất biến xoay vòng Mô tả tính năng, tôi đọc ở đây Một số lựa chọn thay thế miễn phí cho SIFT / SURF có thể được sử dụng trong các ứng dụng thương mại là gì? , rằng "nếu bạn chỉ định hướng cho điểm quan tâm và xoay miếng vá hình ảnh phù hợp, bạn sẽ nhận được bất biến xoay vòng miễn phí", nhưng không biết liệu điều này có thể giải quyết được không hoặc làm thế nào tôi có thể áp dụng điều này cho vấn đề của mình, bất kỳ trợ giúp nào cũng được cảm ơn, cảm ơn


Sử dụng ORB (FAST định hướng và BRIEF xoay) từ thư viện OpenCV.
Harsh Wardhan

Câu trả lời:


9

Theo như các lựa chọn thay thế cho SIFT / SURF, câu hỏi bạn liên kết cung cấp câu trả lời rất hay.

Có hai câu hỏi nữa tôi có thể đọc ra:

  • "Làm thế nào tôi có thể xây dựng một mô tả tính năng hữu ích (ví dụ: bất biến xoay)"?
  • "liên quan đến tuyên bố từ câu hỏi được liên kết, làm thế nào để anh ta thực hiện bất biến xoay vòng miễn phí?"

Xây dựng mô tả tính năng

Đây là một chủ đề nghiên cứu hợp lệ. Mô tả tính năng tốt không phải là thứ mà bất cứ ai cũng có thể xây dựng vào một buổi chiều. Mọi người xuất bản bài viết khi họ mô hình thành công mô tả tính năng với các thuộc tính mong muốn. Đây là một lý do mà hiện tại chỉ có một số mô tả hiện đại được sử dụng và đó cũng là điều tôi khuyên bạn nên làm: tìm một mô tả tính năng phù hợp với nhu cầu của bạn .

Đạt được bất biến xoay vòng "miễn phí"

Bạn có thể xác định độ dốc chiếm ưu thế hoặc hướng ở một miếng vá hình ảnh (khu vực tính năng của bạn). Sau đó, xoay miếng vá hình ảnh để gradient luôn nhìn theo cùng một hướng, ví dụ (trở lên). Ví dụ: nếu bạn có một và một hình ảnh, độ dốc chiếm ưu thế của chúng sẽ lần lượt chỉ sang trái ( ) và phải ( ) và khi bạn xoay chúng theo số tiền này, bạn sẽ có được những hình ảnh tương tự.0|black->gray->white||white->gray->black|-9090

Bằng cách này, bạn sẽ luôn tính toán mô tả trên một bản vá hình ảnh với cùng một hướng thống trị (bản vá được xoay), và do đó bạn đạt được bất biến xoay vòng.


4

Một cách khác để có được bất biến xoay vòng miễn phí, là chọn các đối tượng là bất biến xoay vòng. Chẳng hạn, hình tròn hoặc hình tròn là bất biến đối với phép quay.

Tính năng trích xuất : Chạy phát hiện cạnh. Đối với mỗi vùng lân cận NxNpixel, hãy tính hướng cạnh và biểu đồ 2D cường độ. Tìm tất cả các điểm có tổng cường độ caođộ lan rộng góc cao . Xóa tất cả các điểm không có đối xứng xuyên tâm.

Mô tả tính năng : Tìm tâm của mỗi đối tượng hình tròn. Vì đối tượng là hình tròn, nó không có góc dốc chiếm ưu thế. Tất cả các góc đều bằng nhau. Do đó, một cấu hình xuyên tâm (tổng giá trị pixel trong tọa độ cực) là một mô tả bất biến góc.


Nhân tiện, đó là một trong những lý do mà các fiducials được sản xuất dưới dạng vòng tròn trên bảng mạch điện:

nhập mô tả hình ảnh ở đây


chúng ta đang nói về mô tả keypoint (tính năng) . Nếu chúng ta đang nói về các tính năng (điểm quan tâm) , thì việc phát hiện các bản vá tròn có thể hữu ích - chúng là bất biến xoay vòng kết hợp với mọi mô tả. Nhưng một mô tả được tính toán ở một miếng vá hình tròn thì không - một vòng tròn màu trắng có đường kính ngang màu đen và với một đường thẳng đứng sẽ tạo ra các mô tả rất khác nhau nếu phương pháp bất biến xoay vòng không được sử dụng
penelope

@penelope, tại sao không? Xem xét mô tả sau - hình thu nhỏ của bản vá và bạn so sánh nó với các mô tả khác với tương quan chéo được chuẩn hóa. Bạn không thể nhầm nó với các đối tượng khác theo cách này.
Andrey Rubshtein

Xin lỗi, tôi không hiểu ý của bạn là "hình thu nhỏ của miếng vá" bạn có thể giải thích không? Và các mô tả: tương quan corss bình thường của bản vá của bạn là những gì làm cho nó bất biến xoay vòng, không phải thực tế là bản vá của bạn là một vòng hoặc vòng tròn.
Penelope

@penelope, tôi đoán bây giờ tôi không đủ rõ ràng. Tôi sẽ cố gắng mở rộng nó vào ngày mai. Cảm ơn bạn đã bình luận của bạn.
Andrey Rubshtein

Mong chờ nó :)
Penelope

1

Tôi thà nhìn vào KAZE / AKAZE, hoạt động tốt không kém với tốc độ đáng kể. Các trường hợp biến dạng cũng được dung nạp. OpenCV gần đây đã có được một triển khai thông qua GSoC 2014. Bạn có thể tìm thấy nó ở đây .


1

Nếu bạn ánh xạ lại một bản vá cục bộ xung quanh một điểm đặc trưng để ghi lại tọa độ cực của cực (với điểm gốc là điểm ưa thích), thì các thay đổi tỷ lệ sẽ tương ứng với một bản dịch dọc theo trục xuyên tâm của log log, trong khi các phép quay tương ứng với các bản dịch (có bao quanh) dọc theo trục góc. Sau đó, nếu bạn tính toán biến đổi Fourier hai chiều, các bản dịch theo hướng xuyên tâm và góc sẽ trở thành dịch pha trong miền tần số. Sau đó, nếu bạn tính giá trị tuyệt đối của biến đổi Fourier, pha sẽ biến mất hoàn toàn, và thay đổi tỷ lệ và xoay của bản vá hình ảnh gốc trở nên không đáng chú ý. Vì vậy, giá trị tuyệt đối của biến đổi 2D Fourier của hình ảnh trong tọa độ logar pool log sẽ là mô tả tính năng của bạn.

Vâng, ít nhất là trong lý thuyết. Trong thực tế, bạn cần giới hạn phần mở rộng xuyên tâm của bản vá. Điều này có nghĩa là bạn cần phải cắt đi một phần lớn dữ liệu của mình trước khi tính toán biến đổi Fourier (thực sự là một chuỗi Fourier), do đó, một bản dịch dọc theo hướng xuyên tâm của log log trong tọa độ cực log log không tương ứng chính xác với chỉ một dịch pha trong miền tần số nữa, vì vậy phương thức không hoàn toàn bất biến tỷ lệ. Tôi nghi ngờ rằng nếu bạn sử dụng một số chức năng của cửa sổ - không có sự gián đoạn - trên tọa độ bán kính log log và nhân nó với cường độ màu, vấn đề này sẽ được giảm bớt phần nào.

Tuy nhiên, bộ mô tả tính năng nó vẫn phải là bất biến xoay hoàn hảo.

Tham khảo: Thang đo bất biến mà không chọn thang đo


0

Bạn cũng có thể kiểm tra NHANH CHÓNGBRISK .


Theo như tôi đã tìm kiếm, FAST chỉ là một máy dò được sử dụng với nhiều kết hợp mô tả khác nhau. Và, FAST và BRISK đã được đề cập trong câu hỏi mà chính OP đã liên kết, vì vậy tôi cho rằng anh ta đã có thông tin về sự tồn tại của các phương thức này rồi.
Penelope
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.