Tôi đang cố gắng huấn luyện Mạng thần kinh cách phát hiện các hộp các tông cùng với nhiều lớp người (người).
Mặc dù thật dễ dàng để phát hiện người và phân loại chính xác, nhưng thật khó để phát hiện các hộp các tông.
Các hộp trông như thế này:
Sự nghi ngờ của tôi là cái hộp quá đơn giản của một đối tượng và mạng lưới thần kinh gặp khó khăn trong việc phát hiện ra nó vì có quá ít tính năng để trích xuất từ đối tượng.
Bộ phận của bộ dữ liệu trông như thế này:
personA: 1160
personB: 1651
personC: 2136
person: 1959
box: 2798
Những người đang mặc đồ an toàn khác nhau, dựa trên các mặt hàng được phân loại, trong khi được phát hiện là toàn bộ người, không chỉ là mặt hàng.
Tôi đã cố gắng sử dụng:
ssd300_incetpionv2
ssd512_inceptionv2
faster_rcnn_inceptionv2
Tất cả những thứ này đang phát hiện và phân loại người tốt hơn nhiều so với hộp. Tôi không thể cung cấp chính xác mAP
(không có nó).
Có ý kiến gì không?
Cảm ơn.