Một số lựa chọn thay thế miễn phí cho SIFT / SURF có thể được sử dụng trong các ứng dụng thương mại là gì?


66

Theo tôi hiểu, cả SURF và SIFT đều được bảo vệ bằng sáng chế.
Có bất kỳ phương pháp thay thế nào có thể được sử dụng trong một ứng dụng thương mại một cách tự do không?

Để biết thêm thông tin về bằng sáng chế, hãy kiểm tra: http://opencv-users.1802565.n2.nabble.com/SURF-protected-by-patent-td3458734.html


7
Hãy nhớ rằng họ chỉ được cấp bằng sáng chế ở các quốc gia cho phép bằng sáng chế phần mềm - không bao gồm (chưa) bao gồm Eu
Martin Beckett

1
@MartinBeckett, điều đó bao gồm phát triển, triển khai hoặc cả hai?
Andrey Rubshtein

2
đó là điều khó khăn về bằng sáng chế phần mềm. Một bằng sáng chế dừng sản xuất hoặc bán ở một quốc gia nhưng không nghiên cứu hoặc phát triển. Bây giờ phát triển phần mềm là gì?
Martin Beckett

Chính xác những gì được cấp bằng sáng chế trong SIFT? SIFT có ba giai đoạn: (i) Xây dựng không gian tỷ lệ, (ii) Trình phát hiện điểm chính và (iii) Trình tạo mô tả. Cảm giác của tôi là chỉ có Trình tạo mô tả được cấp bằng sáng chế. Tôi có đúng không? Cảm ơn

Đây không phải là một câu trả lời cho câu hỏi được hỏi, và như vậy thuộc về các ý kiến ​​chứ không phải là câu trả lời.
ThP

Câu trả lời:


62

Cả hai tác giả SIFT và SURF đều yêu cầu phí giấy phép sử dụng thuật toán gốc của họ.

Tôi đã thực hiện một số nghiên cứu về tình huống này và đây là những lựa chọn thay thế có thể:

Máy dò điểm

  • Máy dò góc Harris
  • Harris-Laplace - phiên bản bất biến quy mô của máy dò Harris (một phiên bản bất biến affine cũng tồn tại, được trình bày bởi Mikolajc: 05 và Schmidt, và tôi tin rằng nó cũng không có bằng sáng chế).
  • Các bản vá định hướng đa quy mô (MOP) - được cấp bằng sáng chế, máy dò về cơ bản là Harris đa quy mô, do đó sẽ không có vấn đề gì với điều đó (mô tả là bản vá hình ảnh biến đổi bước sóng 2D)
  • Bộ lọc LoG - do Sift được cấp bằng sáng chế sử dụng xấp xỉ DoG (Sự khác biệt của Gaussian) của LoG (Laplacian của Gaussian) để bản địa hóa các điểm quan tâm theo tỷ lệ, một mình LoG có thể được sử dụng trong thuật toán không có bằng sáng chế, có thể chạy chậm hơn một chút
  • NHANH
  • BRISK (bao gồm một mô tả)
  • ORB (bao gồm một mô tả)
  • KAZE - miễn phí sử dụng, bộ mô tả M-SURF (được sửa đổi cho không gian tỷ lệ phi tuyến của KAZE), vượt trội hơn cả SIFT và SURF
  • A-KAZE - phiên bản tăng tốc của KAZE, miễn phí sử dụng, bộ mô tả M-LDB (bộ mô tả nhị phân nhanh được sửa đổi)

Mô tả quan trọng:

  • Chuẩn hóa gradient - đơn giản, giải pháp làm việc
  • Bản vá hình ảnh biến đổi PCA
  • Bản vá hình ảnh được chuyển đổi Wavelet - chi tiết được đưa ra trong bài viết của MOP, nhưng có thể được thực hiện khác nhau để tránh vấn đề bằng sáng chế (ví dụ: sử dụng cơ sở sóng con khác nhau hoặc sơ đồ lập chỉ mục khác nhau)
  • Biểu đồ độ dốc định hướng
  • TOÀN CẦU
  • MỚI
  • BRISK
  • ORB
  • FREAK
  • LDB

Lưu ý rằng nếu bạn chỉ định hướng cho điểm quan tâm và xoay miếng vá hình ảnh tương ứng, bạn sẽ nhận được bất biến xoay vòng miễn phí. Ngay cả các góc Harris cũng là bất biến xoay vòng và mô tả cũng có thể được thực hiện.

Một số giải pháp hoàn chỉnh hơn được thực hiện ở Hugin, bởi vì họ cũng phải vật lộn để có một máy phát hiện điểm quan tâm không có bằng sáng chế.


Cảm ơn câu trả lời của bạn. Họ có muốn hoàng gia không?
Andrey Rubshtein

1
Vâng, cả hai đều muốn phí bản quyền. Giá cần phải được thương lượng, nhưng nó khoảng 20.000 USD / năm và phí bản quyền là khoảng 5%. MOPs hiện được Microsoft cấp bằng sáng chế (Tôi đã liên hệ với Richard Szeliski để biết thêm thông tin về bằng sáng chế).
Libor

1
Bằng sáng chế là công khai về nguyên tắc, vì vậy nếu bạn muốn biết thêm về nó, hãy tìm kiếm nó trong cơ sở dữ liệu bằng sáng chế (ví dụ: Cơ sở dữ liệu châu Âu .
Geerten

Có bất kỳ trong số các mô tả quan trọng quy mô bất biến?
Diego

1
Harris-Laplace là bất biến quy mô. Hoặc bạn có thể làm cho các máy dò khác bất biến tỷ lệ bằng cách lọc ra cực đại không gian tỷ lệ và tính toán một thang đo đặc trưng cho từng điểm được phát hiện.
Libor

26

Có một phương pháp tương đối mới, bạn có thể muốn xem xét: BRISK , Các điểm chính có thể mở rộng bất biến nhị phân:

Trong bài báo này, chúng tôi đề xuất BRISK, một phương pháp mới để phát hiện, mô tả và khớp chính xác. Một đánh giá toàn diện về các bộ dữ liệu điểm chuẩn cho thấy hiệu suất chất lượng cao thích ứng của BRISK như trong các thuật toán tiên tiến, mặc dù với chi phí tính toán thấp hơn đáng kể (trong trường hợp nhanh hơn so với SURF trong trường hợp). Chìa khóa để tăng tốc nằm ở việc áp dụng bộ phát hiện dựa trên FAST không gian tỷ lệ mới kết hợp với bộ mô tả chuỗi bit từ các so sánh cường độ được lấy bằng cách lấy mẫu chuyên dụng của từng vùng lân cận điểm chính.

Nó không có bằng sáng chế và miễn phí sử dụng (như đã nói với tác giả của thuật toán).


12

Đừng tin bất cứ ai ở đây, hãy nói chuyện với một luật sư. Thế giới pháp lý khác biệt tinh tế với chúng ta, nếu tôi có thể nói. Tùy thuộc vào chính xác những gì bạn muốn làm (và ở đâu, v.v.), có thể có một giải pháp mà bạn có thể sử dụng SURF hoặc SIFT. Tôi đã rất ngạc nhiên trong quá khứ làm thế nào các giấy phép dường như mạnh mẽ có thể vượt qua.


8

Tôi thà nhìn vào KAZE / AKAZE, hoạt động tốt không kém với tốc độ đáng kể. Các trường hợp biến dạng cũng được dung nạp. OpenCV gần đây đã có được một triển khai thông qua GSoC 2014. Bạn có thể tìm thấy nó ở đây . Hướng dẫn OpenCV của nó cũng có mặt ở đây .


Cảm ơn. KAZE có vẻ đầy hứa hẹn - nó có hiệu suất tổng thể tốt hơn so với SIFT / SURF. Mặc dù tính toán tỷ lệ quy mô phi tuyến có thể khó thực hiện, nhưng nó có thể đáng nỗ lực.
Libor
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.