Tôi đang cố gắng tìm một số phương pháp để phát hiện mọi người chỉ sử dụng một camera cách mặt đất 3 mét. Đây là một khung được trả về bởi máy ảnh:
CẬP NHẬT: Kiểm tra video -> http://dl.dropbox.com/u/5576334/top_head_shadow.avi
Để làm điều đó, đầu tiên tôi hiểu rằng tôi phải thực hiện phân đoạn nền trước. Đó là phần dễ dàng.
Với mặt nạ nền trước, tôi có thể thực hiện các thao tác đơn giản như biến đổi Hough để tìm vòng tròn, nhưng cách này chỉ phát hiện 60% số đầu, bao gồm nhiều dương tính giả.
Tôi có thể sử dụng một số kỹ thuật đơn giản khác như phân chia màu sắc, nhưng tôi thấy rằng những người đứng đầu rất khác nhìn từ trên xuống vì kiểu tóc, màu sắc, số lượng tóc, ...
Tùy chọn khác tôi có mặc dù đó là khả năng sử dụng HOG Descriptors, hoặc các tính năng giống Haar, nhưng tôi sẽ cần một cơ sở dữ liệu rộng lớn về những người nhìn từ trên cao để huấn luyện các mô hình. Tôi đã không tìm thấy bất cứ điều gì như thế.
Tôi nghĩ rằng đây sẽ là một vấn đề rất thường xuyên, nhưng tôi không thể tìm thấy nhiều về nó trong tài liệu hoặc internet. Bất kỳ trợ giúp để giải quyết nhiệm vụ này sẽ được đánh giá cao :-)
CẬP NHẬT: Để biết thêm thông tin, Mục tiêu là triển khai một số phương pháp chung để thực hiện theo dõi lưu lượng cho người đi bộ. Nguyên mẫu đầu tiên sẽ được thử nghiệm tại Trung tâm thương mại.