Cách phát hiện hộp các tông bằng Mạng thần kinh

7

Tôi đang cố gắng huấn luyện Mạng thần kinh cách phát hiện các hộp các tông cùng với nhiều lớp người (người).

Mặc dù thật dễ dàng để phát hiện người và phân loại chính xác, nhưng thật khó để phát hiện các hộp các tông.

Các hộp trông như thế này:

Sự nghi ngờ của tôi là cái hộp quá đơn giản của một đối tượng và mạng lưới thần kinh gặp khó khăn trong việc phát hiện ra nó vì có quá ít tính năng để trích xuất từ đối tượng.

Bộ phận của bộ dữ liệu trông như thế này:

personA: 1160
personB: 1651
personC: 2136
person: 1959
box: 2798

Những người đang mặc đồ an toàn khác nhau, dựa trên các mặt hàng được phân loại, trong khi được phát hiện là toàn bộ người, không chỉ là mặt hàng.

Tôi đã cố gắng sử dụng:

ssd300_incetpionv2
ssd512_inceptionv2
faster_rcnn_inceptionv2

Tất cả những thứ này đang phát hiện và phân loại người tốt hơn nhiều so với hộp. Tôi không thể cung cấp chính xác mAP(không có nó).

Có ý kiến gì không?

Cảm ơn.

— Martin Brišiak
nguồn

Bạn đã thử một mạng nông hơn? Điều đó sẽ làm việc tốt với các tính năng ít phức tạp hơn.

— S van Balen

5

Như bạn đã nói:

Sự nghi ngờ của tôi là cái hộp quá đơn giản của một đối tượng và mạng lưới thần kinh gặp khó khăn trong việc phát hiện ra nó vì có quá ít tính năng để trích xuất từ đối tượng.

... Và đó chính xác là vấn đề với nhiệm vụ này. Tôi khuyên bạn nên đào tạo Mạng của mình bằng cách sử dụng toàn bộ nhiều hình ảnh. Nếu bạn đang sử dụng Keras / TensorFlow 2.0, chúng có các chức năng tích hợp sẵn để thực hiện điều đó.

Tôi cũng đề nghị bạn đào tạo một mô hình đầu tiên, sau đó nghiên cứu chính xác các hình ảnh mà Mạng của bạn nghĩ là hộp nhưng không phải (dương tính giả). Tại thời điểm đó, bạn chọn các trường hợp "chính xác", cùng với các trường hợp dương tính giả và xây dựng một tập hợp con của tập dữ liệu mà bạn có. Tập dữ liệu con đó có thể hữu ích để huấn luyện Mạng để phân biệt giữa các hộp thực tế và các đối tượng trông giống như các hộp.

Một lần nữa: sử dụng một lượng lớn hình ảnh tăng cường. Đó là điểm chính của tôi, và đó là những gì tôi sẽ làm.

— Leevo
nguồn

-1

Tôi đề nghị sử dụng một mô hình trước.

Đây là mã đầy đủ của một phân loại hình ảnh đa kính được sàng lọc mà tôi đã thực hiện gần đây: https://datascience.stackexchange.com/a/52772/71442

Có nhiều mẫu khác nhau mà bạn có thể thử: https://keras.io/appluggest/

Với các mô hình đã được sàng lọc trước, bạn có thể sử dụng lại các lớp tích chập của các mô hình lớn và huấn luyện các lớp của bạn lên hàng đầu. Điều này có thể giúp tìm các tính năng cụ thể liên quan đến các hộp.

Hộp phải dễ phát hiện vì hình dạng và màu sắc riêng biệt và đồng nhất của chúng. Vì vậy, tôi nghĩ rằng việc thử một mô hình tiền xử lý được đào tạo trên các lớp tương tự (giống như hộp) có thể giúp ích.

Nếu tất cả các hộp có màu nâu (như trong hình ảnh ví dụ), bạn thậm chí có thể phát hiện các hộp dựa trên các mẫu màu. NN có thể làm điều đó.

Nhìn chung, thật khó để nói những gì đã làm sai mà không nhìn thấy mô hình của bạn. Kiến trúc mô hình có thể có liên quan ở đây.

— Peter
nguồn

tôi đã sử dụng mô hình sơ chế coco, các kiến trúc mà tôi đã sử dụng được đề cập trong câu hỏi

— Martin Brišiak

Vâng chắc chắn, tôi đã nhìn thấy nó. Nhưng tôi không biết chính xác những gì đang hít coco. Có thể một mô hình khác sẽ hoạt động tốt hơn. Ngoài ra kiến trúc mô hình có thể quan trọng khá nhiều (ý tôi là chính mô hình, tôi không thấy điều này trong câu hỏi của bạn). Tuy nhiên, có một chút “thú vị mà bạn không thể đào tạo tốt trên các đối tượng đơn giản như vậy.

— Peter

-1

Bạn có thể thử sử dụng các mô hình Tensorflow hiện có đã được đào tạo trước trên một bộ dữ liệu lớn như MS-COCO, Kitti và Open Images, v.v. Sau đó, bạn có thể tinh chỉnh một mô hình cụ thể mà bạn muốn trên tập dữ liệu của mình.

Danh sách tất cả các mô hình có sẵn để sử dụng có thể được tìm thấy ở đây: https://github.com/tensorflow/models/blob/master/research/object_detection/g3doc/detection_model_zoo.md

Một nguồn tốt về cách thiết lập trình phát hiện đối tượng: https://www.youtube.com/watch?v=Rgpfk6eYxJA (Đừng lo lắng nếu bạn là người dùng Linux, hướng dẫn tương tự có thể được điều chỉnh ngay cả trong các hệ thống Linux)

Bạn có thể sử dụng một công cụ như labellmg để dán nhãn cho hình ảnh của mình để đào tạo ( https://github.com/tzutalin/labelImg )

Hi vọng điêu nay co ich.

— Jitesh Malipeddi
nguồn

3

Tôi đã làm điều đó, câu hỏi là tại sao các hộp khó phát hiện hơn

— Martin Brišiak