Tôi đã xem xét các thuật toán phát hiện đánh dấu để sử dụng với ứng dụng dựa trên động vật và phần lớn công việc tôi có thể tìm thấy rõ ràng tập trung vào phát hiện tính năng trong ảnh 'bình thường'.
Tuy nhiên, phần cứng kinect cung cấp (về cơ bản, một khi bạn đã điều chỉnh) giá trị độ sâu 11 bit cho mỗi pixel.
Hình ảnh chiều sâu này cũng có nhiều tạo tác hình ảnh khác nhau từ bóng đổ xung quanh các cạnh của vật thể (ví dụ: viền đen mạnh mẽ trong video này http://www.youtube.com/watch?v=-q8rRk8Iqww&feature=related ).
Mặc dù một số kỹ thuật thị giác máy truyền thống (ví dụ: phát hiện cạnh) hoạt động tốt với điều này, nhưng một số khác thì không, và có vẻ như có rất ít thông tin trên mạng thảo luận về điều này.
Ví dụ đơn giản, việc sử dụng giá trị độ sâu làm cho việc phát hiện hướng của khối đánh dấu trở nên tầm thường khi bạn đã định vị nó.
Vì vậy, có ai nhìn thấy bất kỳ cuộc thảo luận / giấy tờ / vv bao gồm xử lý hình ảnh chiều sâu để phát hiện tính năng?
Bất cứ ai cũng có thể đề xuất một thuật toán tốt để phát hiện các dấu "độ sâu" (khối origami hiệu quả thay vì các dấu b / w được in)?
Những gì tôi đã làm cho đến nay là thử nghiệm adhoc bằng cách sử dụng opencv để xử lý hình ảnh, nhưng đó không phải là nơi gần ổn định hoặc đủ nhanh.
Nếu bạn liên kết đến một sản phẩm thị giác máy thương mại mà không có một loại thử nghiệm nào, vui lòng đề cập trong câu trả lời của bạn tại sao bạn nghĩ rằng nó phù hợp.