Tôi là một sinh viên thạc sĩ, chuẩn bị một hội thảo về thị giác máy tính. Trong số các chủ đề là trình theo dõi Kanade-Lucas-Tomasi (KLT), như được mô tả trong
J. Shi, C. Tomasi, "Các tính năng tốt để theo dõi" . Thủ tục tố tụng CVPR '94.
Đây là một tài nguyên web mà tôi đang sử dụng để hiểu trình theo dõi KLT. Tôi cần một số trợ giúp với toán học, vì tôi hơi thô lỗ trong đại số tuyến tính và không có kinh nghiệm trước về thị giác máy tính.
Trong công thức này cho (bước 5 trong bản tóm tắt), lưu ý Hessian nghịch đảo:
Trong bài viết này, tốt tính năng để theo dõi được định nghĩa là những ứng dụng mà tổng của ma trận Hessian nghịch đảo có lớn, giá trị riêng tương tự: . Tôi không thể hiểu được nó bắt nguồn từ đâu và như thế nào.
Trực giác là điều này đại diện cho một góc; T nhận được điều đó. Điều đó có liên quan gì đến giá trị bản địa? Tôi hy vọng rằng nếu các giá trị của Hessian thấp, sẽ không có thay đổi và đó không phải là một góc. Nếu chúng cao, đó là một góc. Có ai biết làm thế nào trực giác của giác mạc phát huy tác dụng trong giá trị bản địa của Hessian nghịch đảo để xác định qua các lần lặp của trình theo dõi KLT không?
Tôi đã có thể tìm thấy các tài nguyên cho rằng Hessian nghịch đảo tương quan với ma trận hiệp phương sai hình ảnh. Hơn nữa, hiệp phương sai hình ảnh biểu thị sự thay đổi cường độ, và sau đó nó có ý nghĩa ... nhưng tôi không thể tìm thấy chính xác ma trận hiệp phương sai hình ảnh liên quan đến hình ảnh, chứ không phải vectơ hoặc bộ sưu tập hình ảnh.
Ngoài ra, giá trị riêng có ý nghĩa trong phân tích thành phần nguyên tắc, đó là lý do tại sao tôi có ý tưởng cho ma trận hiệp phương sai hình ảnh, nhưng tôi không chắc chắn làm thế nào để áp dụng điều này cho Hessian, vì nó thường được áp dụng cho hình ảnh. Các Hessian, theo như tôi hiểu, là một ma trận xác định đạo hàm thứ 2 cho x , y , và x y tại một địa điểm nhất định ( x , y ) .
Tôi thực sự đánh giá cao sự giúp đỡ này, vì tôi đã sử dụng nó trong hơn 3 ngày, đó chỉ là một công thức nhỏ và thời gian sắp hết.