Tôi đã làm việc trong một dự án một thời gian, để phát hiện và theo dõi các phương tiện trong video được quay từ UAV, hiện tôi đang sử dụng một SVM được đào tạo về các biểu diễn đặc trưng của các tính năng địa phương được trích xuất từ hình ảnh xe và nền. Sau đó, tôi đang sử dụng một phương pháp phát hiện cửa sổ trượt để thử và bản địa hóa các phương tiện trong hình ảnh, sau đó tôi muốn theo dõi. Vấn đề là cách tiếp cận này chậm đến mức và máy dò của tôi không đáng tin cậy như tôi mong muốn nên tôi nhận được khá nhiều thông tin sai.
Vì vậy, tôi đã xem xét việc cố gắng phân đoạn những chiếc xe từ nền để tìm vị trí gần đúng để giảm không gian tìm kiếm trước khi áp dụng trình phân loại của tôi, nhưng tôi không chắc chắn làm thế nào để đi về điều này, và hy vọng ai đó có thể giúp đỡ?
Ngoài ra, tôi đã đọc về phân đoạn chuyển động với các lớp, sử dụng luồng quang để phân đoạn khung theo mô hình luồng, có ai có bất kỳ kinh nghiệm nào với phương pháp này không, nếu vậy bạn có thể đưa ra một số thông tin đầu vào như bạn nghĩ phương pháp này có áp dụng được không vấn đề của tôi.
CẬP NHẬT : Tôi cũng đã đăng câu hỏi này lên stack stack, và đã có một câu trả lời tuyệt vời , tôi đã thực hiện ý tưởng này và nó đang hoạt động rất tốt và hiện đang điều tra bằng cách sử dụng luồng quang ngoài kỹ thuật này.
Dưới đây là hai khung hình từ một video mẫu