Vấn đề
Tôi đang cố gắng ước tính tư thế 3D của một người được quan sát bằng một camera duy nhất và 5 IMU bị mòn (tứ chi và lưng trên). Các khung máy ảnh được chuyển đổi thành các vectơ đặc trưng dựa trên hình dạng và mỗi IMU cung cấp các biểu diễn bậc bốn 4D theo hướng của chúng.
Tôi đã phục hồi tư thế 3D bằng cách sử dụng từng phương thức bằng cách tìm hiểu ánh xạ từ không gian tính năng đầu vào sang không gian tư thế đầu ra. Bây giờ tôi muốn có được kết quả tốt hơn bằng cách kết hợp cả hai phương thức theo một cách nào đó thông qua phản ứng tổng hợp cảm biến.
Tôi đã thử nối các vectơ đặc trưng của từng phương thức và cũng sử dụng trung bình trọng số của các kết quả đầu ra của chúng. Đây là những cách tiếp cận rất đơn giản và trung bình chỉ mang lại những cải thiện rất nhỏ.
Câu hỏi
Những cách tiếp cận nào khác tôi có thể thử kết hợp hai nguồn dữ liệu không chính xác này?
Có bất kỳ tiền xử lý trên các tính năng nên được thực hiện?
Lưu ý: Sở thích của tôi là tiếp tục sử dụng phương pháp học tập nếu có thể. (tức là tôi không muốn mô hình hóa rõ ràng vật lý / động học / vv)