Độ sâu nghịch đảo (trong hình học) là gì và tại sao tôi sẽ sử dụng nó?


14

Đọc một số bài báo về đo thị giác, nhiều người sử dụng chiều sâu nghịch đảo. Có phải nó chỉ là nghịch đảo toán học của độ sâu (có nghĩa là 1 / d) hoặc nó đại diện cho một cái gì đó khác. Và những lợi thế của việc sử dụng nó là gì?

Câu trả lời:


12

Các tính năng như mặt trời và mây và những thứ khác ở rất xa sẽ có ước tính khoảng cách của inf. Điều này có thể gây ra rất nhiều vấn đề. Để có được xung quanh nó, ước tính nghịch đảo của khoảng cách. Tất cả các inf trở thành số không có xu hướng gây ra ít vấn đề hơn.


1
Không hiểu lắm, nếu tôi đang sử dụng thiết bị kinect, các giá trị đầu ra cho vùng không hợp lệ được đặt bên trong thành 0 , do quá gần hoặc quá xa hoặc phản xạ hoặc chênh lệch. Điều đó có sth. Làm gì với độ sâu nghịch đảo?
zhangxaochen

@zhangxaochen Tham số ngược chiều sâu được sử dụng rộng rãi trong SLAM Monocular và nó giúp ước tính độ sâu của điểm 3D. Kinect cung cấp thông tin 3D hoặc độ sâu của điểm. Tôi không nghĩ sẽ có nhu cầu lớn trong việc sử dụng độ sâu nghịch đảo trong Kinect.
nbsrujan

8

Tham số độ sâu nghịch đảo biểu thị khoảng cách của mốc, d, từ máy ảnh chính xác như đã nói, tỷ lệ với 1 / d trong thuật toán ước tính. Lý do đằng sau cách tiếp cận là, các cách tiếp cận lọc như bộ lọc Kalman mở rộng (EKF) đưa ra một giả định rằng lỗi liên quan đến các tính năng là Gaussian.

Trong phép đo thị giác, thiết lập độ sâu của mốc được ước tính bằng cách theo dõi các tính năng liên quan qua một số loạt khung và sau đó sử dụng thị sai cảm ứng. Tuy nhiên, đối với các tính năng ở xa (liên quan đến độ dịch chuyển của máy ảnh), thị sai kết quả sẽ nhỏ và quan trọng là phân phối lỗi liên quan đến độ sâu đạt cực đại gần với độ sâu tối thiểu với đuôi dài (nghĩa là nó không được mô hình hóa tốt qua Phân phối Gaussian). Để xem một ví dụ, hãy tham khảo Hình 7 trong bài viết của Civera và cộng sự (được đề cập bởi @freakpatrol), hoặc Hình 4 của Fallon et al. ICRA 2012 .

Bằng cách biểu thị độ sâu nghịch đảo (tức là 1 / d), lỗi này trở thành Gaussian. Hơn nữa, nó cho phép đại diện cho các điểm rất xa, ví dụ như các điểm ở vô cực.

Khía cạnh quan trọng của biểu diễn được sử dụng là bài viết của Civera được giải thích trong Phần II B của bài viết của anh ấy (xem Công thức (3)). Ở đây, một mốc được biểu thị liên quan đến tư thế (vị trí và hướng) của máy ảnh đầu tiên mà nó được nhìn thấy. Tư thế này được chụp trong năm tham số đầu tiên của biểu thức (3), trong khi tham số thứ sáu, , biểu thị độ sâu nghịch đảo. Phương trình (4) cung cấp một biểu thức để phục hồi vị trí thế giới của điểm (nghĩa là độ sâu này được chuyển đổi thành độ sâu là 1 / ρ i )ρTôi1/ρTôi


Liên kết ICRA 2012 bị hỏng.
T ....

3

Bài viết giới thiệu phương pháp của Davison đủ dễ hiểu:

Tham số ngược chiều sâu cho SLAM bằng một mắt của Javier Civera, Andrew J. Davison và JM Martınez Montiel DOI: 10.1109 / TRO.2008.2003276


3
Hãy chắc chắn để thêm một số loại tóm tắt ngắn gọn cho câu trả lời của bạn. Điều này không thực sự trả lời câu hỏi của người dùng, nó chỉ liên kết đến một tờ giấy và giấy đó có thể không có sẵn ở liên kết đó sau!
Brian Lynch

Ngoài ra, bạn nên đề cập đến tiêu đề của bài báo và lý tưởng nhất là DOI, vì điều đó có nghĩa là nó sẽ dễ dàng tìm thấy hơn trong tương lai, nếu URL cụ thể đó chết.
Đánh dấu gian hàng

0

Ngoài các lý do được đề cập trong các câu trả lời khác về điều hòa số có độ sâu nghịch đảo, một lý do chính cho thuật ngữ này xuất hiện trong tài liệu đo thị giác cụ thể là ở chỗ độ sâu được tính từ tầm nhìn âm thanh nổi: Sau khi chỉnh lưu, thông tin 3D được suy ra từ khoảng cách trong X giữa nơi một điểm xuất hiện trong hình ảnh của hai camera.

ZdZ= =fBdfB

Khi sử dụng trang web của chúng tôi, bạn xác nhận rằng bạn đã đọc và hiểu Chính sách cookieChính sách bảo mật của chúng tôi.
Licensed under cc by-sa 3.0 with attribution required.