Cách ước tính quãng tám và kích thước cho các đặc điểm hình ảnh được đặt ở các góc Harris


9

Tôi hiện đang làm việc và so sánh hiệu suất của một số trình phát hiện tính năng do OpenCV cung cấp làm cơ sở cho việc kết hợp tính năng trực quan.

Tôi đang sử dụng mô tả SIFT . Tôi đã hoàn thành kết hợp thỏa đáng (sau khi từ chối các kết quả khớp xấu) khi phát hiện các tính năng MSERDoG (SIFT) .

Hiện tại, tôi đang thử nghiệm mã của mình với GFTT (Các tính năng tốt để theo dõi - Góc Harris) để có được sự so sánh, và vì trong ứng dụng cuối cùng, một bộ tính năng GFTT sẽ có sẵn từ quy trình theo dõi tính năng trực quan.

Tôi đang sử dụng cv::FeatureDetector::detect(...)cung cấp cho tôi std::vector<cv::KeyPoint>đầy đủ các tính năng / điểm chính / vùng quan tâm được phát hiện . Cấu trúc cv::KeyPointchứa thông tin cơ bản về vị trí của tính năng, cũng như thông tin về sizeoctavetrong đó điểm chính đã được phát hiện.

Kết quả đầu tiên của tôi với GFTT rất tệ cho đến khi tôi so sánh các thông số sizeoctavethông số điển hình trong các loại tính năng khác nhau:

  • MSER đặt kích thước (trong khoảng từ 10 đến 40px) và để quãng tám thành 0
  • DoG (SIFT) đặt cả kích thướcquãng tám ( tỷ lệ kích thước / quãng tám trong khoảng từ 20 đến 40)
  • GFTT các tham số luôn là : size = 3 , octave = 0

Tôi cho rằng đó là vì mục đích chính của các tính năng GFTT không được sử dụng để khớp mà chỉ trong theo dõi. Điều này giải thích chất lượng thấp của kết quả khớp, vì các mô tả được trích xuất từ ​​các tính năng nhỏ như vậy sẽ không bị phân biệt đối xử và bất biến đối với nhiều thứ , bao gồm cả các thay đổi nhỏ, 1 pixel.

Nếu tôi tự đặt sizecủa GFTT đến 10-12 , tôi nhận được kết quả tốt, rất giống với khi sử dụng MSER hoặc con chó (SIFT) .

Câu hỏi của tôi là: có cách nào tốt hơn để xác định mức tăng size(và / hoặc octave) so với chỉ-đi-với-10-xem-nếu-nó-hoạt động không? Tôi muốn tránh mã hóa sizetăng nếu có thể và xác định nó theo chương trình, nhưng mã hóa vẫn ổn miễn là tôi có một số đối số chắc chắn ủng hộ các lựa chọn của tôi về thuật toán mới size/ sizetăng / sizeước tính .


1
Hey @ penelope: kiểm tra liên kết này anh chàng này đã hoàn thành một số công việc tốt. [ Computer-vision-talks.com/2011/08/ chủ

@Sistu hey trông giống như một so sánh chung rất tốt của các mô tả trong trường hợp chung và với một đối tượng phẳng, nhưng tôi đang làm việc trên các loại hình ảnh cụ thể và tôi cần phải tự kiểm tra. Bên cạnh đó, câu hỏi cụ thể hơn nhiều so với "Tôi cần tài liệu tham khảo so sánh hiệu suất của nhiều loại bộ giải mã". Đó là một liên kết tốt mặc dù, sẽ kiểm tra xem nó ra.
Penelope

Câu trả lời:


4

Tôi không chắc chắn thực sự có một câu trả lời tốt cho câu hỏi chính xác của bạn: điều không gian tỷ lệ của SIFT và SURF thực sự được phát triển để tự động ước tính kích thước lân cận "tốt" xung quanh một điểm chính giống như góc (đó là những tính năng tốt để theo dõi được).

Bây giờ, câu trả lời tích cực hơn sẽ là:

  • xây dựng cơ sở dữ liệu về các điểm chính và kết quả phù hợp (ví dụ: sử dụng các mẫu hiệu chuẩn vuông) và tạo một đánh giá hiệu suất tự động trên cơ sở dữ liệu này để tìm kích thước chính xác. Nhiệm vụ này thực sự có thể thực sự được tự động hóa (xem công việc của Mikolajchot và Schmid về đánh giá khớp điểm)

  • nhúng các tính năng tốt của bạn trong một kim tự tháp hình ảnh để có một số loại tỷ lệ liên quan đến chúng. Bạn có thể tìm tài liệu tham khảo về các điểm quan tâm FAST và Harris đa quy mô, thực hiện điều gì đó rất giống với quy trình này.

Để tìm kích thước khối tối đa, bạn có thể tính toán ước tính hình ảnh của mình với độ mờ của hộp (ít nhiều là những gì toán tử blockSize làm) và xem khi góc biến mất. Tuy nhiên, lưu ý rằng việc làm mờ nhiều hơn sẽ khiến góc xa khỏi vị trí thực của nó.

Nếu bạn thực sự đang tìm kiếm một số sửa chữa nhanh và bẩn, hãy thử các kích thước trong khoảng từ 5x5 đến 11x11 (kích thước điển hình được sử dụng trong kết hợp khối âm thanh nổi). Nếu bạn đang tìm kiếm một tiêu chí thỏa mãn trí tuệ, thì hãy cố gắng tối đa hóa khả năng kết hợp tốt hai điểm tính năng dưới mức độ nhiễu của bạn.


Tôi đang tìm kiếm một giải pháp nhanh hơn và bẩn hơn một chút so với những gì bạn đề xuất. Ngoài ra, tôi chỉ có thể xác định thời tiết một trận đấu là tốt hay xấu sau khi tôi rút được các điểm chính của mình và khớp với thứ gì đó. Ngay cả khi tôi kết hợp chúng hoàn toàn ngẫu nhiên, tôi vẫn nhận được một số kết quả phù hợp - vì vậy đề xuất đầu tiên của bạn không hữu ích. Về phần thứ hai, nhanh và bẩn hơn: Tôi biết không có thông số hoàn hảo, nhưng như tôi đã nói, việc tăng kích thước lên 12 đã giúp - chất lượng tương đương với kết hợp Sift và MSER. Tôi không có tranh luận gì để chọn 12 trên 100 hoặc trên 34 ...
Penelope

0

Để giúp bạn xác định các tham số tốt nhất cho các máy dò, OpenCV có AjusterAd CHƯƠNG cho mục đích đó. Tôi không bao giờ sử dụng nó cho mình nhưng nó có lẽ là cách tiêu chuẩn để xác định các tham số theo chương trình. Cũng cần lưu ý rằng mặc dù Keypoint có một số thuộc tính, nhưng không phải tất cả đều có ý nghĩa đối với tất cả các thuật toán. Bởi vì cấu trúc Keypoint được sử dụng cho các thuật toán khác nhau, nó có tất cả các trường đó nhưng đôi khi chúng không được sử dụng, đó là lý do tại sao bạn có các octave = 0; IMO.


Tôi biết rằng đôi khi một số loại tính năng không phải là loại tốt nhất cho mục đích nào đó, nhưng các tác phẩm gần đây đã thử các cách tiếp cận khi chúng sử dụng nhiều hơn 1 loại v.features / sở thích và đạt được kết quả tốt hơn với sự kết hợp so với bất kỳ loại nào trên chính nó (tôi có thể thêm liên kết để hoạt động nếu bạn quan tâm). Ngoài ra, những gì tôi đang làm ít nhất là một phần nghiên cứu, vì vậy, thử và đánh giá kết quả đạt được với các loại điểm chính khác nhau là điều tôi phải làm, ngay cả khi một số kết quả đó không tốt như hiện tại nghệ thuật. Tôi sẽ xem xét AdjusterAd CHƯƠNG, cảm ơn bạn.
Penelope

Tôi chỉ xem qua chức năng giao diện cung cấp. Nó chỉ có thể tăng hoặc giảm số lượng tính năng mà máy dò phát hiện. Ngoài ra, tôi không có bất kỳ vấn đề nào với các tính năng được phát hiện. Tôi chỉ muốn một cách điều chỉnh kích thước của chúng để chúng có thể được sử dụng tốt hơn trong việc khớp (tăng kích thước lên 10, nhưng tôi không có bất kỳ tranh luận cụ thể (đủ) nào cho lựa chọn đó)
Penelope
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.