Có bất kỳ thuật toán thị giác máy tính cụ thể nhắm mục tiêu hình ảnh chiều sâu?


9

Tôi đã xem xét các thuật toán phát hiện đánh dấu để sử dụng với ứng dụng dựa trên động vật và phần lớn công việc tôi có thể tìm thấy rõ ràng tập trung vào phát hiện tính năng trong ảnh 'bình thường'.

Tuy nhiên, phần cứng kinect cung cấp (về cơ bản, một khi bạn đã điều chỉnh) giá trị độ sâu 11 bit cho mỗi pixel.

Hình ảnh chiều sâu này cũng có nhiều tạo tác hình ảnh khác nhau từ bóng đổ xung quanh các cạnh của vật thể (ví dụ: viền đen mạnh mẽ trong video này http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).

Mặc dù một số kỹ thuật thị giác máy truyền thống (ví dụ: phát hiện cạnh) hoạt động tốt với điều này, nhưng một số khác thì không, và có vẻ như có rất ít thông tin trên mạng thảo luận về điều này.

Ví dụ đơn giản, việc sử dụng giá trị độ sâu làm cho việc phát hiện hướng của khối đánh dấu trở nên tầm thường khi bạn đã định vị nó.

Vì vậy, có ai nhìn thấy bất kỳ cuộc thảo luận / giấy tờ / vv bao gồm xử lý hình ảnh chiều sâu để phát hiện tính năng?

Bất cứ ai cũng có thể đề xuất một thuật toán tốt để phát hiện các dấu "độ sâu" (khối origami hiệu quả thay vì các dấu b / w được in)?

Những gì tôi đã làm cho đến nay là thử nghiệm adhoc bằng cách sử dụng opencv để xử lý hình ảnh, nhưng đó không phải là nơi gần ổn định hoặc đủ nhanh.

Nếu bạn liên kết đến một sản phẩm thị giác máy thương mại mà không có một loại thử nghiệm nào, vui lòng đề cập trong câu trả lời của bạn tại sao bạn nghĩ rằng nó phù hợp.


Có hàng tấn giấy tờ và chương trình cho việc này. Xin lỗi không thể trả lời chi tiết hơn, trên băng thông thấp. Xem ứng dụng RGBDemo, nó bao gồm một trình nhận dạng đối tượng. Ngoài ra, Thư viện PointCloud (PCL), ROS, OpenCV, cho phần mềm và có lẽ là Google Scholar cho các bài viết. Bạn đề cập đến OpenCV không thỏa đáng với bạn, nhưng PCL và RGBDemo có thể.

Tôi không tìm kiếm một bản demo cho thấy kinect, hoặc một số bản demo PC cho thấy cách tạo mô hình 3d từ kinect hoặc bộ công cụ xử lý hình ảnh (ví dụ: opencv). Tôi đang tìm kiếm các thuật toán để nhận dạng tính năng dựa trên hình ảnh chiều sâu.

RGBDemo thực hiện các thuật toán đó. Đọc mã hoặc các tài liệu tham khảo cho mã.

Câu trả lời:


8

Bộ mô tả tính năng 2.5D / 3D yêu thích của tôi để đăng ký và nhận dạng là hình ảnh quay (giấy gốc + thêm chi tiết trong luận án tiến sĩphần mềm có sẵn từ CMU).

Những tiến bộ gần đây khác (tất cả có thể tìm kiếm trực tuyến cho các thuật toán phù hợp) bao gồm: 3D-Sift, Biểu đồ tính năng điểm nhanh, Tính năng xuyên tâm được căn chỉnh bình thường (NARF), Mô tả hạt nhân sâu. Các phương pháp cũ hơn chỉ đơn giản là sử dụng các thuộc tính bề mặt như độ cong và cạnh để xác định các miếng vá vùng.

Tốt nhất? Phụ thuộc vào những gì bạn muốn tìm, quan điểm bất biến, sự lộn xộn bổ sung, v.v.


7

Bạn đã hiểu đúng tất cả các từ khóa, tôi ngạc nhiên rằng bạn thực sự không tìm thấy bất kỳ bài viết liên quan nào trong khi tìm kiếm tài liệu.

May mắn thay, tôi có quyền truy cập vào thư viện kỹ thuật số IEEE Xplore. Tôi không cần bất kỳ thuật toán cụ thể nào trước đây, nhưng có vẻ rất thú vị vì vậy đây là một số kết quả từ một tìm kiếm nhanh mà tôi nghĩ có thể có liên quan (đừng đánh giá chúng theo tiêu đề của chúng, hãy nhìn vào tóm tắt của chúng):

Thật không may, tôi không nghĩ rằng bạn có thể truy cập miễn phí bất kỳ tài liệu nào trong số này, ít nhất là không thông qua thư viện IEEE Xplore. Nếu bạn không có quyền truy cập, có lẽ bạn có thể truy cập bằng học giả Google và có một số cơ sở dữ liệu giấy miễn phí ngoài đó (Tôi đã sử dụng cơ sở dữ liệu Mendeley trở lại khi tôi chưa có quyền truy cập của IEEE). Ngoài ra, chỉ đôi khi các phần của phần trừu tượng hoặc ngẫu nhiên của bài báo cũng mang lại một số kết quả (bạn có thể vấp phải một phiên bản gần như đã hoàn thành trước khi xuất bản của bài viết).

Các truy vấn tìm kiếm tôi sử dụng để tìm các giấy tờ quy định là: hình ảnh 3D , hình ảnh sâu , Kinect . Bạn cũng có thể muốn xử lý khi tìm kiếm hai truy vấn đầu tiên.

Hy vọng điều này sẽ giúp một số! Tôi cảm thấy tiếc vì tôi không thể vào chủ đề nhiều hơn, nghe có vẻ rất thú vị.



@mankoff chỉ từ bản tóm tắt, tôi chỉ thấy công việc tập trung vào theo dõi, và có vẻ như nó tập trung vào việc sử dụng thông tin trực tiếp mà không phát hiện nhiều tính năng. Nhưng sau đó, tôi chỉ đọc tóm tắt, nên không chắc.

Googling các tiêu đề giấy là đủ để tìm các tệp PDF cho một số các giấy tờ. Một nguồn tốt khác là CiteSeer: citeseerx.ist.psu.edu/index Cảm ơn danh sách các giấy tờ!
Xem lại
Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.