Điều quan trọng là phải hiểu rằng vấn đề duy nhất ở đây là để có được các tham số bên ngoài. Nội tại của máy ảnh có thể được đo ngoại tuyến và có rất nhiều ứng dụng cho mục đích đó.
Nội tại máy ảnh là gì?
Máy ảnh thông số nội tại thường được gọi là ma trận camera chuẩn, . Chúng tôi có thể viếtK
K=⎡⎣⎢αu00sαv0u0v01⎤⎦⎥
Ở đâu
và α v là hệ sốtỷ lệ theo hướng tọa độ u và v và tỷ lệ với tiêu cự f của máy ảnh: α u = k uαuαvuvf và α v = k v f . k u và k v là số pixel trên mỗi đơn vị khoảng cáchtheo hướng u và v .αu=kufαv=kvfkukvuv
được gọi là điểm chính, thường là tọa độ của tâm hình ảnh.c=[u0,v0]T
là độ nghiêng, chỉ khác không nếu u và v không vuông góc.suv
Một camera được hiệu chỉnh khi nội tại được biết đến. Điều này có thể được thực hiện dễ dàng để nó không được coi là một mục tiêu trong tầm nhìn máy tính, mà là một bước tầm thường ngoại tuyến.
Camera ngoài là gì?
Camera ngoài hoặc Thông số ngoài làma trận 3 × 4 tương ứng với phép biến đổi euclide từ hệ tọa độ thế giới sang hệ tọa độ camera. R đại diện cho một 3 × 3 ma trận luân chuyển và t một bản dịch.[R|t]3×4R3×3t
Các ứng dụng thị giác máy tính tập trung vào việc ước tính ma trận này.
[R|t]=⎡⎣⎢R11R21R31R12R22R32R13R23R33TxTyTz⎤⎦⎥
Làm thế nào để tôi tính toán homography từ một điểm đánh dấu phẳng?
Homography là ma trận 3 × đồng nhất liên quan đến mặt phẳng 3D và hình chiếu của nó. Nếu chúng ta có mặt phẳng Z = 0 thì biểu đồ đồng nhất H ánh xạ một điểm M = ( X , Y3×3Z=0H trên mặt phẳng này và điểm 2D tương ứng của nó m dưới hình chiếu P = K [ R | t ] làM=(X,Y,0)TmP=K[R|t]
m~=K[R1R2R3t]⎡⎣⎢⎢⎢XY01⎤⎦⎥⎥⎥
=K[R1R2t]⎡⎣⎢XY1⎤⎦⎥
H=K[R1R2t]
Để tính toán homography, chúng ta cần cặp camera thế giới. Nếu chúng ta có một điểm đánh dấu phẳng, chúng ta có thể xử lý hình ảnh của nó để trích xuất các tính năng và sau đó phát hiện các tính năng đó trong cảnh để thu được kết quả khớp.
Chúng ta chỉ cần 4 cặp để tính toán homography bằng Direct Transform Transform.
Nếu tôi có homography, làm thế nào tôi có thể có được tư thế máy ảnh?
Homography và máy ảnh đặt ra K [ R | t ] chứa thông tin tương tự và rất dễ truyền từ người này sang người khác. Cột cuối cùng của cả hai là vector dịch. Cột một H 1 và hai H 2 của homography cũng là cột một R 1 và hai R 2 của ma trận đặt camera. Nó chỉ còn lại cột ba R 3 của [ R | t ] và vì nó phải trực giao nên nó có thể được tính là sản phẩm chéo của cột một và hai:HK[R|t]H1H2R1R2R3[R|t]
R3=R1⊗R2
Do dư thừa, cần phải chuẩn hóa chia cho, ví dụ, phần tử [3,4] của ma trận.[R|t]